L. Pandolfi
Lezioni di Analisi Matematica 2
Questa versione `e scritta in carattere romano e giustificata a destra. Una ver-
sione pi`u leggibile da chi ha problemi di dislessia (scritta in carattere bastone e non
giustificata) ha per titolo Lezioni di Analisi Matematica 2 (per studenti dislessici)
Una versione audio per studenti ipo- o non vedenti `e stata realizzata dal Labo-
ratorio S. Polin dell’Universit`a di Torino e pu`o trovarsi all’indirizzo seguente:
http://www.integr-abile.unito.it/knowledge-transfer/accessible-library-2/
L. Pandolfi, in pensione dal Politecnico di Torino, Dipartimento di Scienze Mate-
matiche “G.L. Lagrange”
i
Il testo presenta tre blocchi principali di argomenti:
ASuccessioni e serie numeriche e di fun-
zioni: Cap. 1, e 2.
BQuesta parte consta di due, da studiar-
si in sequenza.
B1 Funzioni di pi`u variabili e integra-
zione (multipla, di curva e di superficie):
Cap. 38.
B2 Campi conservativi,Cap. 9.
CSistemi di equazioni differenziali:
Cap. 10.
Lo studio dei blocchi AeBpu`o scambiarsi di ordine senza problemi.
Invece, `e consigliabile studiare Cper ultimo. Infatti, lo studio del Cap. 10
richiede il concetto di continuit`a e differenziabilit`a di funzioni di pi`u variabili,
studiato ai paragrafi 4.14.2.
Ovunque nello studio del Cap. 10 `e necessario conoscere il concetto di curva
(ma non le propriet`a differenziali delle curve, e gli integrali di curva).
L’esponenziale di matrici richiede la definizione di serie, Cap. 1, e 2 e il
paragrafo 10.4 richiede il Cap. 9.
ii
Indice
1 Serie numeriche 1
1.1 Successioni numeriche: ricapitolazione . . . . . . . . . . . . . . 1
1.2 Le serie numeriche . . . . . . . . . . . . . . . . . . . . . . . . 3
1.2.1 Serie telescopiche . . . . . . . . . . . . . . . . . . . . . 5
1.3 Criteri di convergenza . . . . . . . . . . . . . . . . . . . . . . 8
1.3.1 Il teorema di Cauchy per le serie . . . . . . . . . . . . 8
1.3.2 Monotonia e serie a termini di segno costante . . . . . 9
1.3.3 Il test di MacLaurin . . . . . . . . . . . . . . . . . . . 13
1.3.4 Serie a termini di segno qualsiasi . . . . . . . . . . . . 17
1.4 Alcuni esempi numerici . . . . . . . . . . . . . . . . . . . . . . 18
1.5 Convergenza condizionata ed incondizionata . . . . . . . . . . 18
1.5.1 Serie dipendenti da un parametro e serie di funzioni . . 21
1.6 Operazioni algebriche e serie . . . . . . . . . . . . . . . . . . . 22
1.7 Prodotto alla Cauchy . . . . . . . . . . . . . . . . . . . . . . . 26
1.8 Appendici ............................. 28
1.8.1 Appendice: ancora sul test di MacLaurin . . . . . . . . 28
1.8.2 La dimostrazione del Teorema di Leibniz . . . . . . . . 29
2 Successioni e serie di funzioni 33
2.1 Introduzione............................ 33
2.2 Distanze tra funzioni . . . . . . . . . . . . . . . . . . . . . . . 34
2.2.1 Il prodotto interno su L2(a, b) .............. 38
2.2.2 Propriet`a della convergenza uniforme . . . . . . . . . . 39
2.3 Serie di funzioni . . . . . . . . . . . . . . . . . . . . . . . . . . 42
2.4 Seriedipotenze.......................... 44
2.4.1 Operazioni sulle serie di potenze . . . . . . . . . . . . . 50
2.4.2 Serie di potenze nel campo complesso . . . . . . . . . . 53
2.4.3 Serie di Taylor . . . . . . . . . . . . . . . . . . . . . . 54
2.4.4 Serie di potenze ed equazioni differenziali lineari . . . . 55
2.5 Serie di Fourier: introduzione . . . . . . . . . . . . . . . . . . 57
iii
iv INDICE
2.5.1 Premesse: le funzioni periodiche . . . . . . . . . . . . . 58
2.5.2 Premesse: le formule d’Eulero . . . . . . . . . . . . . . 60
2.6 La serie di Fourier in L2(L, L)................. 63
2.6.1 Estensioni pari e dispari, e serie di Fourier . . . . . . . 69
2.7 La convergenza puntuale della serie di Fourier . . . . . . . . . 72
3 Lo spazio lineare normato Rn77
3.1 Lo spazio lineare Rn....................... 77
3.1.1 Connessione e convessit`a . . . . . . . . . . . . . . . . . 81
3.1.2 Vettori liberi e vettori applicati . . . . . . . . . . . . . 83
3.2 Basi e basi ordinate . . . . . . . . . . . . . . . . . . . . . . . . 83
3.2.1 Il piano e lo spazio . . . . . . . . . . . . . . . . . . . . 84
3.3 Norme e distanze . . . . . . . . . . . . . . . . . . . . . . . . . 86
3.3.1 Completezza di Rn.................... 90
3.4 La norma euclidea . . . . . . . . . . . . . . . . . . . . . . . . 91
3.4.1 R2eR3con la norma euclidea . . . . . . . . . . . . . 93
3.5 Il prodotto vettoriale . . . . . . . . . . . . . . . . . . . . . . . 95
3.6 Coordinate curvilinee nel piano e nello spazio . . . . . . . . . 96
3.7 Funzioni da Rin Rn....................... 102
4 Funzioni da Rnin Rm107
4.1 Limiti e continuit`a . . . . . . . . . . . . . . . . . . . . . . . . 107
4.1.1 Funzioni continue su insiemi . . . . . . . . . . . . . . . 111
4.2 Le propriet`a di differenziabilit`a . . . . . . . . . . . . . . . . . 112
4.2.1 Il differenziale delle funzioni a valori reali . . . . . . . . 113
4.2.2 Regole di derivazione . . . . . . . . . . . . . . . . . . . 115
4.2.3 Direzione del gradiente e velocit`a di crescita . . . . . . 117
4.2.4 Le funzioni definite tramite integrali . . . . . . . . . . 118
4.3 Le derivate di ordine superiore . . . . . . . . . . . . . . . . . . 120
4.3.1 La formula di Taylor per le funzioni a valori reali . . . 122
4.4 Gliestremi............................. 123
4.5 Il differenziale delle funzioni a valori in Rm........... 127
4.5.1 Regole di calcolo della matrice jacobiana . . . . . . . . 130
4.6 Campi vettoriali . . . . . . . . . . . . . . . . . . . . . . . . . . 130
4.6.1 Operatori differenziali e campi vettoriali . . . . . . . . 132
4.7 Appendici ............................. 134
4.7.1 Appendice: funzioni di due variabili . . . . . . . . . . . 134
4.7.2 Appendice: Propagazione ondosa . . . . . . . . . . . . 140
4.7.3 Appendice: Funzioni omogenee . . . . . . . . . . . . . 146
4.7.4 Appendice: La dimostrazione del teorema 132 . . . . . 147
INDICE v
4.7.5 Appendice: dimostrazione del teorema di Schwarz . . . 148
5 Funzioni implicite ed estremi vincolati 151
5.1 Insiemi di livello . . . . . . . . . . . . . . . . . . . . . . . . . . 152
5.2 Il teorema della funzione implicita . . . . . . . . . . . . . . . . 154
5.2.1 Curve piane definite implicitamente . . . . . . . . . . . 154
5.2.2 Superfici definite implicitamente . . . . . . . . . . . . . 156
5.2.3 Curve intersezione di due superfici . . . . . . . . . . . . 157
5.3 Il teorema della funzione inversa ed i cambiamenti di variabili 158
5.4 Ulteriori esempi . . . . . . . . . . . . . . . . . . . . . . . . . . 160
5.4.1 Superfici assegnate in modo implicito e curve . . . . . . 164
5.5 Estremi vincolati . . . . . . . . . . . . . . . . . . . . . . . . . 165
5.5.1 Estremi vincolati ad una curva piana . . . . . . . . . . 166
5.5.2 Estremi vincolati ad una superficie . . . . . . . . . . . 172
5.5.3 Estremi vincolati ad una curva dello spazio . . . . . . . 173
5.5.4 Osservazione importante . . . . . . . . . . . . . . . . . 174
5.6 Appendice: la dimostrazione del teorema 165 . . . . . . . . . . 174
6 Curve e superfici 177
6.1 Curve parametriche . . . . . . . . . . . . . . . . . . . . . . . . 177
6.1.1 I cambiamenti di parametro e la definizione di curva . . 180
6.1.2 Lunghezza di un arco . . . . . . . . . . . . . . . . . . . 182
6.1.3 Propriet`a differenziali delle curve piane e dello spazio . 185
6.2 Curvepiane ............................ 188
6.3 Lesuperci ............................ 190
6.3.1 Superfici definite parametricamente . . . . . . . . . . . 190
6.3.2 Il piano tangente e la normale a una superficie . . . . . 194
6.4 Appendici ............................. 197
6.4.1 Appendice: le formule di Frenet per curve nello spazio 197
6.4.2 Appendice: Curve in Rn................. 198
7 Integrazione delle funzioni di pi`u variabili 201
7.1 Integrazione delle funzioni di due variabili . . . . . . . . . . . 202
7.1.1 La definizione di integrale . . . . . . . . . . . . . . . . 204
7.1.2 Le propriet`a dell’integrale . . . . . . . . . . . . . . . . 206
7.1.3 Domini di integrazione e curve di Jordan . . . . . . . . 207
7.1.4 Riduzione di integrali doppi ad integrali iterati . . . . . 207
7.2 Integrazione delle funzioni di tre variabili . . . . . . . . . . . . 209
7.3 Formula di riduzione per gli integrali tripli . . . . . . . . . . . 210
7.3.1 Integrazione e Cambiamento di variabili . . . . . . . . 211
vi INDICE
7.4 Alcuni jacobiani che `e importante ricordare . . . . . . . . . . . 214
7.4.1 Volumi delimitati da superfici di rotazione . . . . . . . 215
7.5 Appendici ............................. 217
7.5.1 Appendice: Integrali impropri . . . . . . . . . . . . . . 217
7.5.2 Appendice: Teorema di Brower . . . . . . . . . . . . . 220
8 Integrali di curva e di superficie 223
8.1 Funzioni definite su curve: la densit`a . . . . . . . . . . . . . . 224
8.2 Gli integrali di curva . . . . . . . . . . . . . . . . . . . . . . . 224
8.2.1 Integrali di curva di prima specie . . . . . . . . . . . . 225
8.2.2 Integrali di curva di seconda specie . . . . . . . . . . . 227
8.2.3 Integrali di curva di prima e di seconda specie . . . . . 233
8.2.4 Integrali di curva di seconda specie e forme differenziali 235
8.2.5 Ilusso .......................... 236
8.3 Analisi vettoriale nel piano . . . . . . . . . . . . . . . . . . . . 238
8.3.1 Una considerazione preliminare . . . . . . . . . . . . . 238
8.3.2 Formula di Green . . . . . . . . . . . . . . . . . . . . . 239
8.3.3 Formula di Green e forme differenziali . . . . . . . . . 242
8.3.4 Le forme differenziali e le aree piane . . . . . . . . . . . 243
8.3.5 Le estensioni . . . . . . . . . . . . . . . . . . . . . . . 245
8.4 Integrali di superficie . . . . . . . . . . . . . . . . . . . . . . . 246
8.4.1 Area di una calotta . . . . . . . . . . . . . . . . . . . . 246
8.4.2 Densit`a superficiale . . . . . . . . . . . . . . . . . . . . 249
8.4.3 Integrali di superfici di prima specie . . . . . . . . . . . 250
8.4.4 Integrale di superficie di seconda specie . . . . . . . . . 250
8.4.5 Integrale di superficie e forme differenziali . . . . . . . 252
8.5 Analisi vettoriale nello spazio . . . . . . . . . . . . . . . . . . 253
8.5.1 Formula della divergenza e formula di Gauss . . . . . . 254
8.5.2 Formula di Stokes e superfici parametriche . . . . . . . 260
8.5.3 Estensioni......................... 263
8.6 Appendici ............................. 267
8.6.1 Appendice: fatti da ricordare . . . . . . . . . . . . . . 267
8.6.2 Appendice: osservazioni sulla terminologia . . . . . . . 267
8.7 Appendice: Una dimostrazione del Teorema di Stokes . . . . . 267
9 Campi conservativi 269
9.1 Potenziale ............................. 269
9.1.1 Il calcolo del potenziale . . . . . . . . . . . . . . . . . . 276
9.2 Il linguaggio delle 1-forme differenziali . . . . . . . . . . . . . 278
9.3 Primitive di 2-forme differenziali . . . . . . . . . . . . . . . . . 278
INDICE vii
9.4 Alcune formule importanti . . . . . . . . . . . . . . . . . . . . 280
10 I sistemi di equazioni differenziali 281
10.1Introduzione............................ 281
10.2 Esistenza e unicit`a di soluzione . . . . . . . . . . . . . . . . . 286
10.2.1 Equazioni differenziali lineari a coefficienti costanti . . 289
10.2.2 Equazioni completi ed equazioni di ordine superiore . . 292
10.2.3 Il comportamento in futuro delle soluzioni . . . . . . . 294
10.3Lastabilit`a ............................ 297
10.4 Sistemi piani ed integrali primi . . . . . . . . . . . . . . . . . 300
10.4.1 Integrali primi e stabilit`a . . . . . . . . . . . . . . . . . 303
10.4.2 Stabilit`a asintotica e perturbazioni . . . . . . . . . . . 305
Capitolo 1
Serie numeriche
Le serie numeriche vogliono generalizzare la somma di un numero finito di
termini al caso in cui si sommano infiniti termini. Per questo si introduce il
limite di una opportuna successione di “somme parziali”. Prima di tutto quindi
ricapitoleremo i concetti fondamentali relativi alle successioni numeriche.
1.1 Successioni numeriche: ricapitolazione
Una successione numerica `e una funzione definita su Ned a valori in R
(oppure in C. Noi qui ci limitiamo a considerare successioni a valori reali).
Una successione si indica col simbolo (xn) e si sottintende che nN.
Talvolta, n`e un qualsiasi numero intero maggiore od uguale ad un certo n0
che pu`o anche essere negativo. Se `e necessario specificare il primo dei valori
dell’indice nscriveremo (xn)nn0.
La successione si chiama:
“limitata” quando esiste Mtale che |xn|< M per ogni n;
“convergente”, quando esiste finito il limite limn+xn, che spesso si
indica semplicemente come lim xn;
“divergente” quando lim xn= +oppure quando lim xn=−∞;
“regolare” quando `e convergente oppure divergente;
“oscillante” quando non `e regolare; ossia quando lim xnnon esiste, n´e
finito n´e +e −∞.
Ricordiamo che una successione si dice fondamentale odi Cauchy quando
1
2CAPITOLO 1. SERIE NUMERICHE
per ogni ǫ > 0esiste un Nǫtale che per ogni n > Nǫe per ogni m > 0 si
ha:
|xnxn+m|< ǫ .
In simboli:
ǫ > 0Nǫ| n > Nǫ,m > 0 = |xnxn+m|< ǫ .
Vale:
Teorema 1 Ogni successione convergente `e fondamentale; ogni successione
fondamentale `e limitata e quindi ogni successione convergente `e limitata.
Naturalmente, esistono successioni limitate e non convergenti. Per esempio
la successione di termine generale xn= (1)n. Invece:
Teorema 2 Ogni successione fondamentale `e convergente.
Dim. Accenniamo ai passi cruciali della dimostrazione, che si trova nei testi di Analisi
Matematica 1.
Sia (xn) la successione. Prima di tutto si prova che la successione (xn) ammette
s.successioni convergenti. Questo si vede cos`ı: dato che una successione fondamentale `e
limitata, l’immagine di (xn), ossia l’insieme {xn}`e limitato. Se `e finito, almeno uno dei
suoi elementi `e immagine di infiniti ne quindi la successione (xn) ha una s.successione (xnk)
costante e quindi convergente, di ciamo ad x0.
Se l’insieme {xn}`e infinito, esso ammette almeno un punto di accumulazione x0, per il
Teorema di Bolzano-Weierstrass. Si costruisce quindi una s.successione (xnk) convergente
ad x0.
L’ultimo passo della dimostrazione consiste nel mostrare che `e la successione (xn) stessa
che converge ad x0, usando la definizione di successione fondamentale.
Una successione (xn) `e crescente quando n > m implica xnxm;decrescente
quando n > m implica xnxm.
Un altro risultato importante da ricordare `e il teorema delle funzioni mono-
tone, la cui formulazione particolarizzata al caso delle successioni `e la seguente:
Teorema 3 Sia (xn)una succesione monotona. Esiste lim xn;ossia, ogni
successione monotona `e regolare.
Infine, ricordiamo che se una successione (xn) `e regolare, anche la succes-
sione che si ottiene da essa trascurandone un numero finito di termini, ossia
(xn)n>m `e regolare, ed ha il medesimo limite1.
1in realt`a vale di pi`u: ogni sottosuccessione (xnk) ha il medesimo limite della (xn).
1.2. LE SERIE NUMERICHE 3
1.2 Le serie numeriche
Sia (xn) una successione di numeri. Per fissare le idee sia n1, ma in
modo analogo si pu`o trattare il caso in cui il primo indice sia per esempio 0 o
comunque sia diverso da 1.
Si chiama serie dei numeri xnuna nuova successione (sn) costruita come
segue:
s1=x1, s2=x1+x2, sk=
k
X
n=1
xn,(1.1)
ossia, detto in modo pi`u conciso:
s1=x1, sk=sk1+xk.
I numeri snsi chiamano le somme parziali della serie2. La nuova successione
(sn) si indica anche col simbolo
X
n=1
xno, pi`u semplicemente, Xxn.
I numeri xnsi chiamano i termini della serie e si dice che xn`e il termine
generale della serie.
Nella definizione precedente niente si richiede al comportamento della suc-
cessione (xn) o della successione (sn). Se per`o la successione (sn) converge
allora si dice che la serie converge ; se la successione (sn) diverge (a +op-
pure a −∞) allora si dice che la serie diverge (rispettivamente a +oppure
a−∞). Se la successione (sn) `e priva di limite, si dice che la serie `e oscillante
oindeterminata .
Una serie si dice regolare quando converge oppure diverge.
Il carattere della serie ocomportamento della serie `e la propriet`a di
essere convergente, divergente o oscilante.
Ricapitolando, se la successione (sn) converge ad loppure diverge, dovrem-
mo indicare questo col simbolo
lim
k+
k
X
n=1
xn=α ,
2La successione {sn}delle somme parziali si costruisce dalla (1.1), conoscendo la succes-
sione {xn}. E’ importante notare che, viceversa, nota la successione {sn}, si pu`o ricostruire
la successione {xn}. Infatti `e
x1=s1, e, per k > 1, xk=sksk1.
4CAPITOLO 1. SERIE NUMERICHE
αrispettivamente uguale a loppure +oppure −∞. Pi`u brevemente si scrive
X
n=1
xn=αo anche Xxn=α .
Si dice brevemente che α`e la somma della serie.
Ovviamente, scambiando l’ordine di un numero finito di termini di una
serie, non si cambia n`e il comportamento della serie n`e la sua somma, nel caso
che la serie sia convergente (diremo pi`u avanti cosa accade scambiando tra loro
infiniti termini della serie). E’ anche vero che, sopprimento o aggiungendo un
numero finito di termini, oppure cambiando il valore di un numero finito di
termini, la serie rimane convergente, divergente o oscillante; ossia:
Teorema 4 Il carattere di una serie non muta alterandone un numero finito
di termini.
Va detto esplicitamente che se la serie `e convergente, la somma della
serie cambia alterandone un numero finito di termini. Se invece `e di-
vergente, la sua somma non cambia.
Inoltre:
Teorema 5 Se Pxnconverge allora limn+xn= 0.
Dim.Si indichi con sk=Pk
n=1 xn. L’ipotesi `e che la successione (sk) converge
e quindi anche la successione sk1converge, ed al medesimo limite. Dunque,
0 = lim
k+sklim
k+sk1= lim
k+(sksk1) = lim
k+xk.
Di conseguenza:
Esempio 6 La serie di “termine generale” (1)nn, ossia la serie
X(1)nn
non converge.
Invece:
1.2. LE SERIE NUMERICHE 5
Esempio 7 La successione
(qn)n0
(con qRfissato) si chiama progressione geometrica (di ragione q). La
serie +
X
n=0
qn
si chiama serie geometrica . E’ noto che, se q6= 1,
N
X
n=0
qn=1qN+1
1q
e quindi
lim
N+
1qN+1
1q=
+
X
n=0
qn=
1/(1 q) se |q|<1
+se q1
oscillante altrimenti.
Si noti che la serie geometrica per definizione inizia con l’indice n= 0.
Se per qualche ragione si deve iniziare con un primo indice diverso, di ci`o va
tenuto conto nel calcolo della somma. Per esempio
+
X
n=0
1
2n=1
11/2= 2 ,
+
X
n=1
1
2n= 2 1 = 1 .
1.2.1 Serie telescopiche
Sia (bk)k0una successione e sia
an=bnbn1
(ovviamente definita per n1). Consideriamo la serie
+
X
n=1
an.(1.2)
Una serie ottenuta con questo procedimento si chiama serie telescopica .
E’ facile calcolare le somme parziali di una serie telescopica:
s1=a1=b1b0, s2=a1+a2= (b1b0) + (b2b1) = b2b0
e, in generale,
sk=bkb0.
Dunque:
6CAPITOLO 1. SERIE NUMERICHE
Teorema 8 La serie telescopica costruita sopra converge se e solo se
lim bk=lR
e in tal caso +
X
n=1
an=lb0;
diverge se lim bk= +oppure se lim bk=−∞. La serie `e oscillante se e solo
se la successione (bk)`e priva di limite.
Esempi
Vediamo alcuni esempi.
Esempio 9 Consideriamo la serie
+
X
n=1
log 1 + 1
n.
Questa serie diverge. Infatti,
log 1 + 1
n= log n+ 1
n= log(n+ 1) log n .
Sia ha quindi una serie telescopica e
k
X
n=1
log 1 + 1
n= log(k+ 1) da cui lim
k+
k
X
n=1
log 1 + 1
n= +.
Esempio 10 Consideriamo la serie
+
X
n=1
1
n2+n.
Si vede che questa `e una serie telescopica notando che
1
n2+n=1
n1
n+ 1 =1
n+ 1 1
n
e inoltre bn= 1/n 0. Dunque,
+
X
n=1
1
n2+n= 1 .
1.2. LE SERIE NUMERICHE 7
Se per qualche ragione si devono sommare i termini con nn0, allora
+
X
n=n0
1
n2+n=1
n0
.
Consideriamo ora la serie
+
X
n=1
1
4n2+ 8n+ 3 .
Decomponendo in fratti semplici,
1
4n2+ 8n+ 3 =1
4"1
n+ 3/21
n+ 1/2#=1
4[bn+1 bn], bn=1
n+ 1/2.
Si tratta quindi di una serie telescopica, la cui somma `e 1/6.
Infine:
Esempio 11 Anche la serie seguente `e una serie telescopica:
+
X
n=2
log
1
n
q(n+ 1)1/(n1) 1 + 1
n1/(n1)
.
Infatti,
1 + 1
n1/(n1) 1
n
q(n+ 1)1/(n1) =(n+ 1)1/n
n1/(n1)
e quindi la serie `e uguale a
+
X
n=2 1
nlog(n+ 1) 1
n1log n=
+
X
n=2
[bn+1 bn], bn=1
nlog(n+ 1) .
Dunque, la serie converge e la sua somma `e (1/2) log 3.
Nonostante gli esempi importanti della serie geometrica e delle serie tele-
scopiche, calcolare esplicitamente le somme parziali di una serie `e pressoch´e
impossibile. L’unica cosa che si pu`o fare `e dare condizioni per la convergenza
o divergenza di serie, e quindi, se gi`a si sa che la serie converge, approssimarne
numericamente la somma.
8CAPITOLO 1. SERIE NUMERICHE
1.3 Criteri di convergenza
Come si `e detto, `e ben difficile calcolare esplicitamente le somme parziali di
una serie. Per questo `e necessario conoscere dei criteri che assicurino la con-
vergenza o meno di una serie, senza calcolarne le somme parziali. Dato che
la somma di una serie `e il limite della successione delle somme parziali, do-
vremo basarci su criteri per l’esistenza del limite, che non facciano intervenire
la preliminare conoscenza del limite stesso. Essenzialmente, questi criteri si
riducono a due soli: il teorema di Cauchy per le successioni e il teorema delle
funzioni monotone. Esaminiamone le conseguenze per il caso delle serie.
1.3.1 Il teorema di Cauchy per le serie
Vediamo come si trascrive il Teorema di Cauchy nel caso in cui (sn) `e la
successione delle somme parziali della serie
X
k
xk.(1.3)
Sia, per fissare le idee, m > n. Allora,
|smsn|=
m
X
k=n+1
xk
.
Possiamo quindi enunciare il Teorema di Cauchy come segue:
Teorema 12 La serie (1.3) converge se e solo se per ogni ǫ > 0esiste Nǫtale
che per ogni coppia di indici n,mcon
m > n > Nǫ
vale
m
X
k=n+1
xk
< ǫ .
D’altra parte, notiamo che
m
X
k=n+1
xk
m
X
k=n+1 |xk|
e quindi:
1.3. CRITERI DI CONVERGENZA 9
Corollario 13 Se la serie
X
k|xk|
converge, anche la serie
X
k
xk
converge.
Dim.Infatti, se Pk|xk|converge, per ogni ǫ > 0 esiste Nǫtale che per m >
n > Nǫsi ha
m
X
k=n+1
xk
m
X
k=n+1 |xk|< ǫ .
E quindi anche la serie Pkxkconverge, grazie al Teorema 12.
Pi`u avanti vedremo una diversa dimostrazione di questo corollario.
Si dice che la serie Pkxkconverge assolutamente quando `e convergente la
serie Pk|xk|. Il corollario precedente quindi pu`o enunciarsi in questo modo:
Teorema 14 Una serie assolutamente convergente `e convergente.
Questo risultato `e molto importante perch´e la serie Pk|xk|`e una serie a termini
positivi. Criteri di convergenza facilmente usabili esistono appunto per il caso
delle serie a termini positivi, come ora andiamo a vedere.
1.3.2 Monotonia e serie a termini di segno costante
Usando il teorema delle funzioni monotone, `e facile vedere che
Teorema 15 Sia (xn)una successione a termini positivi. La serie degli xn
converge se e solo se esiste Mtale che sn< M per ogni n.
Dim.Ricordiamo il significato di Pnxn: prima si costruisce la successione
sk=
k
X
n=1
xn
e poi si studia il limite limk+sk.
La successione (sk) `e crescente perch´e, essendo xk0 per ogni k,
sk+1 =
k+1
X
n=1
xn="k
X
n=1
xn#+xk+1
k
X
n=1
xn=sk.
10 CAPITOLO 1. SERIE NUMERICHE
Dunque la successione (sk) ammette limite, finito o meno, per il teorema delle
funzioni monotone. Il limite `e finito se e solo se la successione (sk) `e su-
periormente limitata, ossia se e solo se esiste Mtale che sk< M per ogni
k.
Il teorema facilmente si estende al caso di successioni a termini negativi
oppure definitivamente positive o negative.
Inoltre:
Teorema 16 (Teorema del confronto) siano PxnePyndue serie a ter-
mini positivi, con xnynper ogni n. Allora, se Pynconverge, anche Pxn
converge; se Pxndiverge lo stesso fa Pyn.
Questo semplice risultato ha come conseguenza due importanti criteri di
convergenza per le serie a termini positivi:
Teorema 17 (Criterio della radice) Sia xn0per ogni n:
Se esiste q[0,1) ed esiste Ntale che
n
xn< q n > N ,
allora la serie converge.
Se esiste q > 1e se esiste una s.successione (xnk)tale che
nk
xnk> q
allora la serie diverge.
Dim.Da n
xn< q < 1 segue infatti xn< qne, se 0 q < 1, la convergenza
della serie Pxnsegue dall’esempio 7 e dal Teorema del confronto.
Se per un q > 1 vale
nk
xnk> q ossia xnk> qnk
allora3
lim xnk= +.
Di conseguenza il termine generale della serie non tende a zero, e quindi la
serie non converge.
Si ha inoltre:
3per provarlo si usi il teorema di confronto per i limiti.
1.3. CRITERI DI CONVERGENZA 11
Teorema 18 (Criterio del rapporto) Se vale definitivamente
xn+1
xn
< q < 1 (1.4)
allora Pxnconverge; se xn+1
xn> q > 1allora Pxndiverge.
Dim.Proviamo l’asserto nel caso in cui la (1.4) valga per ogni n.
Se xn+1
xn< q < 1 allora x2< qx1,x3< qx2< q2x1e, in generale,
xn< qn1x1. Si sa che se 0 q < 1 allora Px1qn=x1Pqnconverge, si
veda l’esempio 7. L’asserto segue quindi dal Teorema del confronto. In modo
analogo si vede il secondo asserto.
Ricordando i teoremi sui limiti, si pu`o enunciare il corollario seguente:
Corollario 19 Sia Pxnuna serie a termini positivi. Vale:
se limn+xn+1
xn=q < 1allora la serie converge;
se limn+n
xn=q < 1allora la serie converge;
se limn+xn+1
xn=q > 1allora la serie diverge;
se limn+n
xn=q > 1allora la serie diverge.
Concludiamo con un esempio:
Esempio 20 Consideriamo la serie
+
X
n=1
1
n.(1.5)
Mostriamo che questa serie `e divergente.
Si noti che per ogni x 1 vale
xlog(1 + x).
Infatti, la funzione log(1 + x) `e concava e quindi ha grafico che sta sotto a
ciascuna delle sue tangenti; e y=x`e la tangente nell’origine.
In particolare vale 1
nlog 1 + 1
n.
Abbiamo visto che la serie a termini positivi
+
X
n=1
log 1 + 1
n
12 CAPITOLO 1. SERIE NUMERICHE
diverge, si veda l’esempio 9. Dunque, per confronto, anche la serie (1.5)
diverge4.
La serie (1.5) si chiama serie armonica .
Si osservi che il carattere della serie armonica non pu`o determinarsi usando
il criterio del rapporto oppure quello della radice. Infatti, nel caso della serie
armonica,
lim xn+1
xn
= lim n
n+ 1 = 1 ,lim n
xn= lim n
s1
n= 1 .
All’esempio 24 vedremo una serie di termine generale xnche `e convergente
e tale che anche per essa vale
lim xn+1
xn
= 1 ,lim n
xn= 1 .
Combinando questi due esempi si ha:
niente pu`o dedursi dai criteri della radice e del rapporto,
se il numero qche compare in tali criteri `e uguale ad 1.
Le serie a termini positivi hanno una notevole propriet`a, che non `e condi-
visa dalle generiche serie a termini di segno variabile: se si altera l’ordine di
infiniti termini di una serie si trova una nuova serie, che generalmente ha un
comportamento diverso da quello della serie di partenza. Invece:
Teorema 21 Due serie a termini positivi, con gli stessi elementi in ordine
diverso, hanno la medesima somma.
La formula di Stirling
Per ragioni che vedremo, molto spesso il termine generale di una serie contiene
dei fattoriali. I fattoriali hanno un “buon comportameno” rispetto al rapporto,
nel senso che permettono facilmente di fare semplificazioni. Invece, il criterio
della radice sembra difficile da usare in presenza dei fattoriali. In realt`a non `e
cos`ı grazie alla formula di Stirling
n!nnen2πn ossia lim nnen2πn
n!= 1 .(1.6)
La dimostrazione si trova nei testi di Analisi Matematica 1.
4L’esempio 24 presenta una diversa dimostrazione di questo fatto.
1.3. CRITERI DI CONVERGENZA 13
1.3.3 Il test di MacLaurin
Consideriamo le somme parziali di una serie a termini positivi
+
X
n=1
an.
Esse sono s1=a1=a1·1
s2=a1+a2=a1·1 + a2·1
s3=a1+a2+a3=a1·1 + a2·1 + a3·1
.
.
.
Queste espressioni si possono interpretare come somma di aree di rettangoli
interpretando 1 come misura della base ed ancome misura dell’altezza.
sk=
k
X
n=1
an=Zk
1a(x) dx
ove a(x) `e la funzione costante a tratti
a(x) = anse 1 nx < (n+ 1) .
Dunque, la somma della serie `e l’integrale improprio di a(x):
+
X
n=1
an= lim
k+sk=Z+
1a(x) dx .
Pensiamo ora ai rettangoli messi come in figura 1.1, a sinistra, e supponia-
mo di poter trovare due funzioni, f(x) e g(x), che prendono valori maggiori o
uguali a zero e tali che inoltre valga
x[n, n + 1) =g(x)anf(x).
Si veda la figura 1.1, a destra. In tal caso si ha
Zk
1g(x) dxskZk
1f(x) dx .
La serie `e a termini positivi e quindi regolare; le funzioni sono non negative e
quindi ammettono integrale improprio finito o meno. Dunque, dal teorema di
confronto per i limiti, si ha
Z+
0g(x) dx
+
X
n=1
anZ+
0f(x) dx .
Ricapitolando,
14 CAPITOLO 1. SERIE NUMERICHE
Figura 1.1: Il test di MacLaurin
x
y
x
y
Se R+
1g(x) dx= +allora la serie diverge;
Se R+
1f(x) dx < +allora la serie converge. In questo caso si trovano
anche stime, da sotto e da sopra, per la somma della serie.
Il caso tipico in cui quest’argomento si applica facilmente `e il caso in cui
esiste una funzione g(x) definita su [0,+), decrescente e inoltre
an=g(n).
In questo caso,
x[n, n + 1) =g(x)an=g(n)g(x1) .(1.7)
Definiamo, per x0,
f(x) = g(x1)
e notiamo che la (1.7) si scrive
g(x)an=g(n)f(x)x[n, n + 1) .
Inoltre,
Z+
1f(x) dx=Z+
1g(x1) dx=Z1
0g(x) dx+Z+
1g(x) dx ,
Z+
1g(x) dx < + Z+
1f(x) dx < +.
Ossia, nel caso descritto, i due integrali impropri hanno il medesimo com-
portamento e questo comportamento `e ereditato dalla serie. Possiamo quindi
enunciare:
1.3. CRITERI DI CONVERGENZA 15
Teorema 22 ( Test di MacLaurin )Sia g(x)una funzione non negativa e
decrescente definita su [0,+). Si consideri la serie
+
X
n=1
g(n).
Le sue somme parziali verificano
Zk
1g(x)dxsk=
k
X
n=1
anZ1
0g(x)dx+Zk
1g(s)ds . (1.8)
In particolare, la serie a termini positivi
+
X
n=1
g(n)
converge se e solo se
Z+
0g(x)dx < +.
L’interesse di questo teorema sta nel fatto che talvolta l’integrale di g(x)
pu`o esplicitamente calcolarsi mediante il calcolo delle primitive; e comun-
que esistono test efficienti per lo studio della convergenza o divergenza degli
integrali impropri.
Esempio 23 Si sa gi`a che la serie armonica
+
X
n=1
1
n
diverge. La serie
+
X
n=2
1
nlog2n
converge, come si vede dal criterio di MacLaurin. Infatti, la funzione
f(x) = 1
xlog2x
ha integrale improprio convergente:
lim
T+ZT
2
1
xlog2xdx= lim
T+"1
log 2 1
log T#=1
log 2 .
16 CAPITOLO 1. SERIE NUMERICHE
Procedendo in modo analogo5si provi invece che
+
X
n=2
1
nlog n= +.
Esempio 24 Si calcola immediatamente
Z+
0
1
(x+ 1)γdx=(<+se γ > 1
= +se γ1.
Dunque,
+
X
n=1
1
nγ
converge per γ > 1, diverge altrimenti.
Possiamo combinare l’esempio 24 col criterio di confronto, ottenendo:
Corollario 25 Consideriamo la serie P+
n=1 an. Vale:
se esitono M > 0eγ > 1tali che
0anM1
nγ,
allora la serie converge.
se esistono m > 0eγ1tali che
anm1
nγ
allora la serie diverge.
In particolare, possiamo enunciare:
Se an0 e se esiste γ > 1 tale che
an= o 1
nγ,(1.9)
allora la serie Panconverge.
Per ora, stiamo lavorando con serie a termini positivi, ma non abbiamo scritto
esplicitamente questa condizione perch´e vedremo, al Corollario 27, che il test
precedente vale per ogni serie.
5si usi d
dxlog [log x] = 1
xlog x.
1.3. CRITERI DI CONVERGENZA 17
1.3.4 Serie a termini di segno qualsiasi
Sulle serie a termini di segno qualsiasi, limitiamoci ad osservare due propriet`a.
Si `e gi`a detto che se la serie P|xn|converge, si dice che la serie Pxn
converge assolutamente . Ricordiamo, dal teorema 15:
Teorema 26 Una serie assolutamente convergente `e convergente.
Ricordiamo ora che f= o(g) quando f/g `e un infinitesimo, e ci`o accade se
e solo se |f|/|g|`e un infinitesimo. Quindi:
Corollario 27 Se esite γ > 1tale che an= o 1
n, allora la serie Pan
converge assolutamente, ed `e quindi convergente.
Infine, si dice che una serie `e a segni alterni se ha forma
X(1)nxncon xn>0; (1.10)
ossia se gli addendi si susseguono cambiando segno ad ogni passo. Esiste, per
le serie a segni alterni, una notevole condizione sufficiente di convergenza, e
anche una stima per la somma della serie:
Teorema 28 ( Criterio di Leibniz )Se valgono ambedue le condizioni
limn+xn= 0
la succesione {xn}`e decrescente, ossia xnxn+1 0per ogni n
allora la serie a segni alterni (1.10) converge; inoltre, detta sla somma della
serie, per ogni nvale:
la differenza
s
k
X
n=1
(1)nxn
ha segno opposto ad xk; ossia, l’approssimazione `e per eccesso se l’ultimo
termine sommato `e positivo; per difetto se `e negativo.
Vale la stima
s
k
X
n=1
xn |xk+1|.
La dimostrazione della convergenza `e nell’Appendice 1.8.2.
18 CAPITOLO 1. SERIE NUMERICHE
Esempio 29 Consideriamo la serie
+
X
n=1
(1)n
n.
Questa serie si chiama serie di Mengoli . Il criterio di Leibniz mostra che
questa serie converge. La somma della serie `e nota:
+
X
n=1
(1)n
n= log 2 .
Il Teorema 28 d`a anche una stima dell’errore che si commette sommando N
termini: l’errore `e minore di 1/(n+ 1).
1.4 Alcuni esempi numerici
Le figure 1.2, 1.3 e 1.4 mostrano alcuni esempi numerici di somme parziali di
serie convergenti. Le serie sono specificate nelle intestazioni delle figure.
Figura 1.2: P+
n=0(1/2)n= 2 a sinistra, P+
n=0(1/2)n= 2/3 a destra
0 1 2 3 4 5 6 7 8 9 10
0
0.5
1
1.5
2
2.5
3
3.5
4
0 1 2 3 4 5 6 7 8 9 10
0
0.5
1
1.5
2
2.5
3
3.5
4
1.5 Convergenza condizionata ed incondizio-
nata
Il concetto di serie generalizza quello di somma finita. In una somma finita
il risultato non dipende dall’ordine degli addendi (propriet`a commutativa del-
l’addizione). Nel caso delle serie, l’asserto analogo vale se si scambiano tra di loro
1.5. CONVERGENZA CONDIZIONATA ED INCONDIZIONATA 19
Figura 1.3: P+
n=0 1/n! = ea sinistra, P+
n=0(1)n/n = log 2 a destra
0 1 2 3 4 5 6 7 8 9 10
0
0.5
1
1.5
2
2.5
3
3.5
4
0 1 2 3 4 5 6 7 8 9 10
0
0.5
1
1.5
2
2.5
3
3.5
4
un numero finito di termini. E’ FALSO se si scambia il posto di infiniti termini.
Mostriamo un esempio:
Esempio 30 Consideriamo la serie di Mengoli P+
n=1(1)n/n. Si sa che questa
serie converge. Mostriamo che `e possibile scambiare il posto di infiniti termini,
in modo da ottenere una serie divergente a +. Ricordiamo per questo che
+
X
n=1
1
n
diverge e quindi anche
+
X
n=1
1
2n
diverge. Conviene vedere una dimostrazione di questo fatto, diversa da quella
gi`a vista: consideriamo
5k
X
n=k
1
2n=1
2
5k
X
n=k
1
n1
2[4k1
5k] = 2
5
(si `e usato il fatto che si sommano 4ktermini, ciascuno dei quali `e maggiore
di 1/5k).
Ci`o contrasta col criterio di convergenza di Cauchy, e mostra che la serie
diverge.
Dato che il carattere di una serie non dipende dai primi elementi, anche
ciascuna delle serie +
X
n=R
1
2n(1.11)
20 CAPITOLO 1. SERIE NUMERICHE
Figura 1.4: P+
n=1 1/n2=π2/6 a sinistra e P+
n=0(1)n/[(2n+ 1)! ] = sin(1) a
destra
0 1 2 3 4 5 6 7 8 9 10
0
0.5
1
1.5
2
2.5
3
3.5
4
−1 0 1 2 3 4 5 6
−0.2
0
0.2
0.4
0.6
0.8
1
1.2
sin(1)
y
x
`e divergente.
Ora consideriamo la serie di Mengoli, per semplicit`a cambiata di segno.
Essa converge a log 2. Vogliamo riordinarne gli elementi in modo da trovare
una serie divergente a +. Per questo sommiamo prima i termini di indice
pari, fino ad un certo indice ˜
k1tale che
˜
k1
X
n=1
1
2n>5.
Questa `e la somma parziale s˜
k1della serie riordinata. Sottraiamo quindi il
primo termine di indice dispari, ossia 1 ottenendo una somma parziale sk1tale
che
sk1>4.
Consideriamo ora la serie (1.11) con R=˜
k1+ 1. Come si `e detto, questa
serie diverge. Dunque, possiamo sommare ulteriori termini di indice pari alla
somma parziale sk1gi`a ottenuta, fino a trovare una somma parziale maggiore
di 9; sottraiamo quindi il primo dei termini di ordine dispari non ancora usati
(che `e 1/3, minore di 1). Si trova una nuova somma parziale, diciamo sk2,
maggiore di 8:
sk2>8 = 23.
Continuiamo a sommare termini di indice pari (e quindi positivi) fino ad avere
una somma parziale maggiore di 24+ 1 e quindi sottraiamo il primo termine
di indice dispari non usato (che `e certamente minore di 1, infatti `e 1/5). Si
trova una somma parziale sk3tale che
sk3>24.
1.5. CONVERGENZA CONDIZIONATA ED INCONDIZIONATA 21
Procedendo in questo modo si trova un riordinamento che conduce ad una
serie divergente a +.
Si potrebbe mostrare che per ogni scelta di l`e possibile riordinare la serie
di Mengoli in modo tale da trovare una serie convergente ad l, inclusi l= +
ed l=−∞, o anche in modo da trovare una serie oscillante.
Diciamo che una serie converge incondizionatamente quando una serie
converge ad le inoltre quando qualunque serie ottenuta riordinandone gli
elementi converge al medesimo numero l.
La convergenza incondizionata si caratterizza come segue:
Teorema 31 ( Teorema di Dirichlet ) Una serie converge incondiziona-
tamente se e solo se converge assolutamente.
Se ci`o non accade `e possibile riordinare gli elementi della serie in modo
da cambiare il carattere della serie, e anche in modo da ottenere una serie
convergente ad un qualsiasi numero assegnato, o divergente a +oppure a
−∞.
In particolare:
Corollario 32 Ogni serie a termini di segno costante converge incondiziona-
tamente.
1.5.1 Serie dipendenti da un parametro e serie di fun-
zioni
Torniamo a considerare la serie geometrica,
+
X
n=0
qn.
Questa serie dipende dal parametro qe, come si `e visto, converge se |q|<1,
diverge se q1 ed oscilla se q 1.
Facendo variare il parametro q, ciascuno degli addendi viene ad essere una
funzione di q,
fn(q) = qn.
Dunque, la serie geometrica pu`o intendersi come serie di funzioni. In generale,
data la successione ( fn(x) ) i cui elementi sono funzioni (tutte con lo stesso
dominio) si chiama serie di funzioni la serie
+
X
n=0
fn(x).
22 CAPITOLO 1. SERIE NUMERICHE
La somma della serie si calcola punto per punto; ossia, per ogni fissato valore
di xsi calcola la somma della serie di numeri P+
n=0 fn(x).
Il dominio comune alle funzioni f(q) = qn`e R, ma abbiamo notato che
la serie geometrica converge (ad 1/(1 q)) soltanto per |q|<1. Dunque, in
generale, il dominio su cui `e definita la somma di una serie di funzioni `e pi`u
piccolo del dominio comune delle funzioni.
Le serie di funzioni si studieranno al Capitolo 2. Va tenuta presente la loro
definizione per capire alcune sottigliezze del paragrafo 1.6.
1.6 Operazioni algebriche e serie
Il concetto di “serie” estende quello di “somma finita”. Le somme finite godono
di utili propriet`a, come per esempio la propriet`a distributiva del prodotto sulla
somma, la propriet`a associativa e “dissociativa”. Ci possiamo chiedere se le
analoghe propriet`a valgono per le serie. Per questo dobbiamo tener conto di
due problemi:
la “somma di somme finite” non dipende dall’ordine degli addendi:
(a1+a2) + (b1+b2) = a1+a2+b1+b2=a1+b1+a2+b2.
Si sa gi`a che la somma della serie varia cambiando l’ordine dei suoi
termini. Quindi dovremo aspettarci che una propriet`a analoga non valga
necessariamente per le serie.
la somma di serie `e definita tramite il concetto di limite; le relazioni tra
limiti ed operazioni sono dissimmetriche. Di ci`o dobbiamo tener conto per
enunciare i risultati relativi alle serie.
Queste osservazioni suggeriscono di elencare prima le relazioni tra limiti ed operazioni
sia nella versione “giusta” che nella versione “sbagliata”:
1.6. OPERAZIONI ALGEBRICHE E SERIE 23
GIUSTA SBAGLIATA
1La somma dei limiti `e uguale
al limite della somma
1Il limite della somma `e uguale
alla somma dei limiti
2il prodotto dei limiti `e uguale
al limite del prodotto
2il limite del prodotto `e uguale
al prodotto dei limiti
3a Sia {γn}limitata. Se an0
anche γnan0.
3a Sia {γn}limitata. Se {γnan}
converge, anche {an}converge.
3b Sia {γn}limitata. Se an0
anche γnan0.
3b Sia {γn}limitata. Se {an}
converge, anche {γnan}converge.
Ricordiamo brevemente perch´e le affermazioni a destra sono sbagliate: per esempio
nel caso 1 , il limite della somma di due funzioni pu`o esistere, senza che le due funzioni
individualmente abbiano limite, come `e il caso del limite, per x+, quando le due
funzioni sono
f(x) = x3+ sin x , g(x) = x+ 1
1xsin x .
In questo caso,
f(x) + g(x) = 2 sin x
1x,lim
x+[f(x) + g(x)] = 0 .
Questo limite non `e uguale a
lim
x+f(x)+lim
x+g(x)
per la semplice ragione che i due limiti non esistono.
Il caso 2 , del prodotto `e analogo. Vale la pena per`o di vedre un caso banale che per`o
pu`o inndurre in errore nel caso delle serie: NON `e vero che la formula seguente vale per OGNI
numero reale γ:
lim [γf(x)] = γ[lim f(x) ] .
Questa formula vale solo se γ6= 0 oppure se lim f(x) esiste finito, come mostrano gli esempi
delle funzioni
f(x) = x3, g(x) = sin x .
In ambedue i casi, se γ= 0,
lim
x+[γf(x)] = 0 ,lim
x+[γg(x)] = 0
mentre le espressioni
γlim
x+f(x), γ lim
x+g(x)
non hanno senso.
24 CAPITOLO 1. SERIE NUMERICHE
Vediamo ora il caso 3a . Chiaramente, da γnan0 non si pu`o dedurre la convergenza
a zero di {an}: si consideri il caso γn0 ed an1.
Il caso 3b : si consideri l’esempio della successione {an}con an= (n1)/(n+ 1),
convergente ad 1, mentre γn= (1)n. La successione {γnan}`e oscillante.
Richiamato ci´o, definiamo:
Somma di serie
"+
X
n=1
an#+"+
X
n=1
bn#=
+
X
n=1
(an+bn).
Prodotto di una serie per un numero
α·"+
X
n=1
an#=
+
X
n=1
(αan).
In queste definizioni, l’ordine degli addendi `e quello indicato.
Supponiamo
+
X
n=1
an=l ,
+
X
n=1
bn=m .
Allora:
1) somma di serie. Vale
+
X
n=1
(an+bn) = l+m
purch´e uno almeno dei due limiti sia un numero oppure sia lche msiano ambedue +
oppure −∞.
2) prodotto di un numero per una serie. La definizione ha senso (e l’uguaglianza
vale) solo se α6= 0 oppure se la serie converge.
La definizione di prodotto di serie `e pi`u complessa e si vedr`a nel paragrafo 1.7.
Si potrebbe anche provare:
Teorema 33 Sia Pan=lRe sia an>0per ogni n. Sia {γn}una successione limitata.
Allora, la serie Pγnanconverge.
Gli esempi seguenti mostrano i problemi che si possono incontrare usando le operazioni
sulle serie senza le dovute cautele:
Esempio 34 Consideriamo la serie seguente:
Xcn, cn= 0 .
Ovviamente la somma della serie `e 0. Scrivendo
cn=an+bn, an= (1)n, bn=(1)n
1.6. OPERAZIONI ALGEBRICHE E SERIE 25
si potrebbe essere tentati di usare una specie di “regola dello scomponendo” e scrivere
Xcn=Xan+Xbn.
Ovviamente questo non ha senso, perch´e le due serie a destra non convergono; e quindi non
definiscono numeri che si possano sommare.
Un esempio analogo, un po pi`u riposto, `e quello delle serie
Xan,Xbn, an=1
n+ 1 , bn=n(nn)
n3+ 8 .
Le due serie non convergono mentre la serie
X[an+bn]
converge.
La regula del prodotto sembra “pi`u innocua” nel senso che sembra pi`u difficile sbagliare.
In realt`a anche questa regola `e fonte di errori, come mostra l’esempio seguente:
Esempio 35 Sia xun parametro reale. Studiare la convergenza della serie
+
X
n=1
x
n1/2(1 + nx2).(1.12)
Si lascia per esercizio di provare che la serie converge per ogni x. Si noti che essa certamente
converge per x= 0 perch´e in tal caso tutti i termini della serie sono nulli. Per`o, sembra del
tutto naturale mettere in evidenza xportandolo fuori dal segno di serie, scrivendo
x"+
X
n=1
1
n1/2(1 + nx2)#
e magari studiando la convergenza della serie pi´u semplice”
+
X
n=1
1
n1/2(1 + nx2).
Si dimentica in questo modo che il parametro xpu`o essere nullo. Se x6= 0 questa serie
converge e il procedimento seguito, di mettere in evidenza x, `e corretto. Se per`o x= 0,
l’ultima serie scritta non converge, mentre la (1.12) ovviamente converge.
L’errore `e consistito nel “mettere in evidenza il fattore 0 dai termini della serie, errore
favorito dal fatto che il fattore `e stato indicato col generico simbolo x.
Ci sono anche altri errori nei quali si pu`o cadere trattando le operazioni sulle serie senza
la dovuta attenzione:
Esempio 36 Un modo veloce di “calcolare” la somma della serie geometrica
S=
+
X
n=0
qn
26 CAPITOLO 1. SERIE NUMERICHE
`e il seguente:
S= 1 + q"+
X
n=0
qn#= 1 + qS
Dunque,
(1 q)S= 1 ossia S=1
1q.
Questo risultato, apparentemente giusto, `e in realt`a sbagliato. Infatti da nessuna parte si `e
usata la condizione |q|<1 e quindi sembrerebbe da questo calcolo che la serie geometrica
converga per ogni valore di q, cosa notoriamente falsa.
Si lascia per esercizio di trovare l’errore in questo ragionamento.
Infine, vediamo una diversa dimostrazione del Teorema 26 basata sulle propriet`a illu-
strate in questo paragrafo:
La serie P|xn|`e una serie a termini positivi. Se essa converge, dal teorema 15 conver-
gono anche le due serie PynePzn, con
yn=xnse xn>0
0 altrimenti , zn=xnse xn<0
0 altrimenti.
Quindi, per il teorema 16, converge anche P(ynzn) che `e Pxn.
1.7 Prodotto alla Cauchy
Il prodotto di serie pu`o definirsi in vari modi. Quello pi`u utile `e il prodotto alla Cauchy .
L’espressione del prodotto alla Cauchy pu`o sembrare macchinosa, ma se ne capisce la ragione
se si considera l’esempio di un prodotto di polinomi. Consideriamo il caso del prodotto di
due polinomi di grado 4. Il prodotto
(a0+a1x+a2x2+a3x3+a4x4)(b0+b1x+b2x2+b3x3+b4x4)
`e la somma di tutti i possibili addendi ajbkxk+jcon 0 j4, 0 k4. Raccogliendo i
coefficienti degli addendi del medesimo grado il prodotto si scrive come
a0b0
+(a1b0+b0a1)x
+(a2b0+a1b1+a0b2)x2
+(a3b0+a2b1+a1b2+a0b3)x3
+(a4b0+a3b1+a2b2+a1b3+a0b4)x4.
Posto x= 1, il prodotto
(a0+a1+a2+a3+a4)(b0+b1+b2+b3+b4)
si trova scritto come segue:
a0b0
1.7. PRODOTTO ALLA CAUCHY 27
+(a1b0+b0a1)
+(a2b0+a1b1+a0b2)
+(a3b0+a2b1+a1b2+a0b3)
+(a4b0+a3b1+a2b2+a1b3+a0b4).
Ci`o suggerisce le due definizioni seguenti:
Si chiama convoluzione delle due successioni (an) e (bn) la successione (cn) con
cn=
n
X
r=0
anrbr=anb0+an1b1+an2b2+···a2bn2+a1bn1+a0bn.
Si chiama prodotto alla Cauchy delle due serie
+
X
n=0
an,
+
X
n=0
bn(1.13)
la serie +
X
n=0
cn, cn=
n
X
r=0
anrbr.
Osservazione 37 Se l’indice di una, o ambedue, le serie non parte da zero, la formula del
prodotto alla Cauchy si intende scritta aggiungendo un numero finito di termini tutti nulli,
in modo da far partire gli indici da 0.
La convergenza di ambedue le serie (1.13) non implica la convergenza del loro prodotto
alla Cauchy. Vale invece:
Teorema 38 Le due serie (1.13) convergano, ed abbiano somma rispettivamente αeβ.
Allora:
se le due serie convergono ambedue assolutamente, anche il loro prodotto alla Cauchy
converge assolutamente ad αβ.
se una delle due serie converge e l’altra converge assolutamente, il prodotto alla
Cauchy converge ad αβ, in generale non assolutamente.
Concludiamo con un esempio che mostra due serie convergenti (non assolutamente), il
cui prodotto alla Cauchy non converge.
Esempio 39 Consideriamo la serie (convergente per il criterio di Leibniz)
+
X
n=1
(1)n
n
e calcoliamone il prodotto alla Cauchy con se stessa. Notiamo che l’indice di questa serie
parte da 1 invece che da zero e quindi la formula del prodotto alla Cauchy va lievemente
modificata come detto nell’sservazione 37:
+
X
n=1 "n1
X
r=1
(1)nr
nr
(1)r
r#=
+
X
n=1
(1)n"n1
X
r=1
1
nr r2#.
28 CAPITOLO 1. SERIE NUMERICHE
Si vede facilmente che la funzione
f(x) = 1
nx x2
`e crescente per 1 < x < n/2 e decrescente per n/2< x < n 1 e quindi ha minimo per
x= 1 e per x=n1. Il minimo vale 1/n1. Dunque
n1
X
r=1
1
nr r2n2
n1:
il termine generale del prodotto alla Cauchy non converge a zero e quindi la serie ottenuta
come prodotto alla Cauchy non converge.
1.8 Appendici
1.8.1 Appendice: ancora sul test di MacLaurin
Il test di MacLaurin pu`o ulteriormente precisarsi notando che la (1.8), ossia
Zk
1
g(x) dxsk=
k
X
n=1
anZ1
0
g(x) dx+ + Zk
1
g(x) dx ,
si pu`o anche scrivere come
0"k
X
n=1
an#Zk
1
g(x) dxZ1
0
g(x) dx
e che, al crescere di k, la successione
k (" k
X
n=1
an#Zk
1
g(x) dx)
decresce. e quindi ammette limite compreso tra 0 ed R1
0g(x) dx. Infatti, si ha:
(" k
X
n=1
an#Zk
1
g(x) dx)("k+1
X
n=1
an#Zk+1
1
g(x) dx)
=ak+1 +Zk+1
k
g(x) dx=Zk+1
k
[g(x)g(k+ 1)] dx0.
Ossia, al crescere di k, i valori delle somme parziali e dell’integrale “si avvicinano”
anche se l’integrale improprio (e quindi anche la serie) diverge. Quest’osservazione pu`o
usarsi per ottenere “stime asintotiche” delle somme parziali della serie per grandi valori di
k. Mostriamo questo considerando l’esempio della serie armonica.
Sia
g(x) = 1 se 0 x1
1/x se 0 x > 1.
1.8. APPENDICI 29
La serie armonica `e +
X
n=1
g(n)
e quindi diverge, dal criterio di MacLaurin. E’ questo un modo di vedere che la serie
armonica diverge, diverso da quello visto all’esempio 1.5. Per`o, il criterio di MacLaurin d`a
un’informazione in pi`u:
0
k
X
n=1
1
nZk
1
1
xdxZ1
0
g(x) dx ,
ossia
0
k
X
n=1
1
nlog k1.
E inoltre,
γ= lim
k"k
X
n=1
1
nlog k#
esiste, γ(0,1). Il numero γcos`ı definito si chiama costante d’Eulero .
1.8.2 La dimostrazione del Teorema di Leibniz
La dimostrazione di questo teorema, e di teoremi pi`u generali di Abel e di Dirichlet che ora
vedremo, `e interessante perch´e permette di introdurre il concetto di sommazione per parti,
da confrontare con quello di integrazione per parti.
Nonostante che il carattere di una serie non dipenda dai primi addendi, in quest’appen-
dice `e bene specificare con cura i valori degli indici. Quindi scriveremo per esempio {bn}n1
per intendere che il valore del primo indice della successione `e 1. Inoltre, se {bn}n1indica
una successione, con {Bn}n1intendiamo la successione delle sue somme parziali:
Bn=
n
X
k=1
bk.
Sia {bn}n1una successione. Con {bn}n1intendiamo la successione {(bn+1bn)}n1.
Sia 1 r < k. La formula di sommazione per parti `e:
k
X
n=r
(∆bn)cn= [bk+1ckbrcr]
k
X
n=r
bn+1cn.
Questa formula si dimostra facilmente scrivendo la somma per esteso:
k
X
n=r
(∆bn)cn=
(br+1 br)cr+ (br+2 br+1)cr+1 + (br+3 br+2)cr+2 +···+ (bkbk1)ck1+ (bk+1 bk)ck
=brcr+ [br+1(cr+1 cr)br+2(cr+2 cr+1) ··· bk(ckck1)] + bk+1ck
30 CAPITOLO 1. SERIE NUMERICHE
=bk+1ckbrcr
k1
X
n=r
bn+1cn=bk+1 [ck+1 ck] + bk+1ck+1 brcr
k1
X
n=r
bn+1cn
=bk+1ck+1 brcr
k
X
n=r
bn+1cn.
Ci serve inoltre un risultato preliminare:
Lemma 40 Sia P+
n=1 bnuna serie tale che la successione {Bn}delle somme parziali sia
limitata e sia {cn}una successione positiva decrescente. Allora, la serie
+
X
n=1
Bn(∆cn)
converge assolutamente.
Dim.Si noti che la successione {cn}n1`e convergente, lim cn=l, per il teorema della
funzione monotona, e quindi limitata. Anzi,
0cnc1.
Inoltre, cn+1 cn<0.
L’asserto del lemma segue perch´e ora proviamo che P+
n=1 |Bncn|<+. Infatti,
k
X
n=1 |Bncn|=
k
X
n=1 |Bn|(cncn+1)M
k
X
n=1
(cncn+1) = M(c1ck+1)M c1.
Osservazione 41 Si noti che il Lemma 40 non richiede la convergenza della serie P+
n=1 bn.
Consideriamo ora la serie P+
n=1 bncne notiamo che
bn=BnBn1= Bn1.
Introducendo i numeri dndefiniti da
dn1=cnossia dn=cn+1
e usando la regola di sommazione per parti con primo indice 2, le sue somme parziali si
rappresentano come segue:
k
X
n=1
bncn=b1c1+
k
X
n=2
(∆Bn1)cn=b1c1+
k
X
n=2
(∆Bn1)dn1
=B1c1+
k
X
n=2
(∆Bn1)dn1=B1c1+ [Bk+1dk+1 B2d2]
k
X
n=2
Bn+1dn(1.14)
=B1c1+ [Bk+1ck+2 B2c3]
k
X
n=2
Bn+1cn+1 .(1.15)
1.8. APPENDICI 31
Dunque, per garantire la convergenza della serie P+
n=1 bncn, basta dare condizioni che
garantiscano l’esistenza dei due limiti
lim
k+Bkck+1 ,(1.16)
lim
k+"k
X
n=2
Bn+1cn+1#.(1.17)
Un criterio per questo `e dato dal Teorema di Dirichlet , che immediatamente implica il
criterio di Leibniz:
Teorema 42 ( Teorema di Dirichlet )Sia {cn}n1una successione a valori positivi, de-
crescente e convergente a zero. Sia P+
n=1 bnuna serie tale che {Bn}n1rimane limitata.
Allora, la serie P+
n=1 bncnconverge.
Dim.Infatti, il limite (1.16) `e nullo perch´e {Bn}`e limitata e cn0. Il limite (1.17) esiste
per il Lemma 40.
Dimostrazione del criterio di convergenza di Leibniz. La dimostrazione del criterio
di Leibniz per la serie a segni alterni
X
n
(1)nan, an0
con {an}decrescente e convergente a zero, segue immediatamente: basta definire bn= (1)n
ecn=an0 e notare che
Bn=1 se n`e dispari
+1 se n`e pari
e quindi {Bn}n1rimane limitata.
Una diversa condizione per l’esistenza dei due limiti (1.16) e (1.17) `e data dal teorema
seguente:
Teorema 43 ( Teorema di Abel )Sia {cn}n1una successione a valori positivi e decre-
scente. Sia P+
n=1 bnuna serie convergente. Allora, la serie P+
n=1 bncnconverge.
Dim.Per ipotesi, esistono ambedue i limiti lim cke lim Bk. Dunque, esiste il limite (1.16).
La successione {Bk}, essendo convergente `e anche limitata e quindi il limite (1.17) esiste
per il Lemma 40.
32 CAPITOLO 1. SERIE NUMERICHE
Capitolo 2
Successioni e serie di funzioni
In questo capitolo studiamo le successioni e le serie di funzioni. Studiamo quindi particolari
metodi per approssimare una data funzione f(x) mediante serie i cui termini sono funzioni
elementari: monomi o funzioni trigonometriche.
2.1 Introduzione
Ricordiamo, dal Par. 1.5.1, che una successione di funzioni `e una trasformazione che ad
ogni numero naturale nassocia una funzione fn(x) definita su un dominio I, lo stesso per
ogni n. Stando cos`ı le cose, il problema della convergenza della successione di funzioni si
studia per ogni fissato xI; ossia si studia una successione numerica per ogni valore del
parametro x. Se la succesisone (fn(x)) converge a f(x) per ogni xI0I, si dice che la
successione (fn(x)) converge puntualmente ad f(x) su I0.
In realt`a questo `e un modo piuttosto semplicistico di procedere. Le applicazioni ri-
chiedono infatti di studiare la convergenza rispetto ad opportuni concetti di distanza” tra
funzioni. Ci`o `e quanto facciamo in questo capitolo.
Notazione.Da ora in poi di regola useremo una notazione meno “elementare”: per
indicare una funzione invece di scrivere f(x) scriveremo semplicemente f. Invece, col simbolo
f(x) intenderemo il valore che la funzione fassume nel punto x. In certi casi questo pu`o
condurre ad ambiguit`a ed allora useremo notazioni del tipo xf(x) per indicare la funzione
che ad xassocia f(x). Va detto che la notazione fnon si pu`o usare per specifiche funzioni:
la funzione xsin xsi indicher`a semplicemente con sin x. Dunque, successioni e serie di
funzioni di regola si indicheranno con la notazione
(fn),Xfn,
+
X
n=1
fn
ecc. Invece scriveremo esplicitamente xquando dovremo considerare successioni o serie di
funzioni particolari, per esempio
X5n(x1)n,X1
nx2+ 1 X1
n2sin nx .
33
34 CAPITOLO 2. SUCCESSIONI E SERIE DI FUNZIONI
2.2 Distanze tra funzioni
Noi considereremo funzioni definite su un fissato insieme Iche sar`a sempre un intervallo.
Specificheremo volta per volta se tale intervallo deve essere limitato e/o chiuso. Inoltre, non
considereremo tutte le possibili funzioni definite su I, ma le funzioni di una delle tre classi
seguenti:
col simbolo C(I) si intende l’insieme delle funzioni continue su I. Implicitamente
usando questo simbolo si intende che Isia limitato e chiuso, I= [a, b].
col simbolo L1(I) si intende l’insieme delle funzioni il cui valore assoluto `e integrabile
su I:ZI|f(x)|dx < +.
L’insieme I`e ora un intervallo qualsiasi.
col simbolo L2(I), si intende l’insieme delle funzioni tali che
ZI|f(x)|2dx < +.
L’insieme I`e ora un intervallo qualsiasi.
Si noti la presenza del segno |·|e del quadrato. Ovviamente, se la funzione pren-
de valori reali, |f(x)|2=f2(x). Per`o molto spesso la funzione f(x) prende valori
complessi e in tal caso il segno di modulo `e necessario.
Osservazione 44 L’integrale che usiamo `e l’integrale di Riemann. Si ricordi che una fun-
zione integrabile secondo Riemann `e necessariamente limitata. Usando questa propriet`a,
si potrebbe mostrare che, se l’intervallo I`e limitato, i due insiemi L(I) ed L2(I) hanno i
medesimi elementi. I due insiemi invece sono diversi se I`e illimitato o se si usano concetti
diversi di integrale, che permettono di integrare anche funzioni illimitate.
A noi interessa sapere che:
Ilimitato L2(I) L1(I).
I tre insiemi sopra definiti sono spazi lineari, nel senso visto nei corsi di geometria,
rispetto alle operazioni
(f+g) (x) = f(x) + g(x),(αf) (x) = αf (x).
In questi spazi lineari si introduce una distanza come segue:
in C(I) si pone
d(f, g) = max
xI|f(x)g(x)|
(si noti che il massimo esiste, dal teorema di Weierstrass, perch´e l’intervallo I`e
limitato e chiuso.) La distanza sopra definita si indica anche col simbolo1
d(f, g).
1non spieghiamo la ragione dell’indice ”. Per spiegarlo, dovremmo introdurre una
famiglia di altre distanze, che non useremo.
2.2. DISTANZE TRA FUNZIONI 35
Le distanze in L1(I) e in L2(I) si indicano anche, rispettivamente, con i simboli
d1(f, g), d2(f, g)
e sono definite da
d1(f, g) = ZI|f(x)g(x)|dx , d2(f, g) = ZI|f(x)g(x)|2dx1/2
.
Si noti che in questi simboli l’intervallo I`e sottinteso e che spesso si scrive, rispettivamente,
||fg||,||fg||1,||fg||2.
usando il simbolo di “norma della differenza”, al posto di quello di distanza
Osservazione 45 Non ci serve essere precisi su questo. Per`o va detto che solamente la
norma ||·||`e effettivamente una norma e che solo d(f, g) `e effettivamente una distanza.
Infatti, se I= [0,1], se f(x) = 0 per ogni xe se g(x) = 0 per x6= 1/2 mentre g(1/2) = 1,
allora d1(f, g) = 0, d2(f, g) = 0 nonostante che fegsiano tra loro diverse.
Accade che
d(f, g)< ǫ
quando il grafico di g(x) sta in un “tubo” di ampiezza ǫintorno a quello di f(x), come
in figura 2.1. Si noti che il “tubo” pu`o essere disegnato intorno ad una qualsiasi delle due
funzioni. Ci`o fatto si richieder`a che il grafico dell’altra stia in tale tubo”.
Figura 2.1: Distanza d(f, g)
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1
−1.5
−1
−0.5
0
0.5
1
1.5
2
1/2
1/2
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1
−2
−1.5
−1
−0.5
0
0.5
1
1.5
2
1/2
1/2
Invece, d1(f, g)< ǫ quando accade che `e minore di ǫl’area del trapezoide di |f(x)g(x)|,
ossia l’area della superficie compresa tra i grafici delle due funzioni.
La figura 2.2, a sinistra, riporta il grafico di |f(x)g(x)|ed a destra quello di |f(x)
g(x)|2(per le medesime due funzioni f(x) e g(x)) con tratteggiata la regione la cui area
deve essere piccola” se si vuole che queste “distino di poco” rispettivamente in L1(a, b) ed
36 CAPITOLO 2. SUCCESSIONI E SERIE DI FUNZIONI
Figura 2.2: Le distanze d1(f, g) e d2(f, g)
0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1
−0.5
0
0.5
1
1.5
2
2.5 x 104
0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1
−1
0
1
2
3
4
5x 108
in L2(a, b). La figura suggerisce che la distanza, nel senso L1, o L2, tra due funzioni possa
essere “piccola” anche se i due grafici diventano molto distanti” per certi valori di x.
Scriviamo ora esplicitamente la definizione di convergenza rispetto alla distanza d.
Questo tipo di convergenza si chiama convergenza uniforme .
La successione di funzioni (fn(x)) converge uniformemente ad f(x) su Ise per ogni
ǫ > 0 esiste Nǫtale che per ogni n > Nǫvale
max
xI|fn(x)f(x)|< ǫ per ogni xI,
ossia, per n > Nǫvale
|fn(x)f(x)|< ǫ per ogni xI.
Per contrasto, diamo la definizione di convergenza puntuale: la successione (fn(x)) converge
puntualmente ad f(x) su Iquando per ogni xIe per ogni ǫ > 0 esiste un numero Nǫ(x)
tale che se n > Nǫ(x) si ha, per questo particolare numero x,|fn(x)f(x)|< ǫ. Cambiando
il punto xcambia anche il numero Nǫ(x). Si ha convergenza uniforme quando si pu`o trovare
un numero Nǫche va bene per ogni xI.
Diamo ora la definizione di convergenza in L1(I) ed in L2(I).
La successione (fn(x)) converge ad f(x)
in L1(I) se per ogni ǫ > 0 esiste Nǫtale
che per ogni n > Nǫsi ha
ZI|fn(x)f(x)|dx < ǫ .
La successione (fn(x)) converge ad f(x)
in L2(I) se per ogni ǫ > 0 esiste Nǫtale
che per ogni n > Nǫsi ha
ZI|fn(x)f(x)|2dx < ǫ2.
2.2. DISTANZE TRA FUNZIONI 37
La convergenza in L1(I) si chiama anche convergenza in media e la convergenza in
L2(I) si chiama anche convergenza in media quadratica mentre, come si `e gi`a detto, la
convergenza in C(I) si chiama convergenza uniforme.
Osservazione 46 Supponiamo che la successione di funzioni (fn) sia definita su un dominio
I,I=I1I2. Se la successione converge uniformemente su I, essa converge uniformemente
sia su I1che su I2e, viceversa, se la successione converge uniformemente su I1e anche su
I2, essa converge uniformemente anche su I. Asserto analogo vale anche per la convergenze
in media e per la convergenze in media quadratica.
Vediamo ora due figure che illustrano il significato della convergenza uniforme e della
convergenza in media. La fig. 2.3 a sinistra suggerisce la convergenza uniforme. La figura
a destra vuol suggerire la convergenza in media, e vuol sottolineare che la convergenza in
media non implica la convergenza puntuale.
I grafici rappresentati a destra sono quelli delle funzioni ent con n= 1, 5, 10, 100.
Si provi dettagliatamente, facendo uso della definizione, che la successione (ent), t
[0,1], converge a zero in media ed in media quadratica, ma non uniformemente.
Figura 2.3: Convergenza uniforme e convergenza in media
0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1
−1.5
−1
−0.5
0
0.5
1
1.5
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
n=1
n=5
n=10
n=100
Infine, enunciamo il lemma seguente, immediata conseguenza del teorema di confronto
per i limiti. La dimostrazione `e lasciata per esercizio.
Lemma 47 Sia (fn)una successione di funzioni su un intervallo I. Su tale intervallo sia
anche definita una funzione g. Sia (γn)una successione numerica tale che
lim γn= 0 .
se vale
d(fn, g)< γn
allora la successione (fn)converge uniformemente a g.
38 CAPITOLO 2. SUCCESSIONI E SERIE DI FUNZIONI
se vale
d1(fn, g)< γn
allora la successione (fn)converge a gin L1(I).
se vale
d2(fn, g)< γn
allora la successione (fn)converge a gin L2(I).
2.2.1 Il prodotto interno su L2(a, b)
Su L2(a, b) si pu`o definire un prodotto interno oprodotto integrale come segue: siano fe
gdue funzioni a quadrato integrabile. Si pu`o provare che il loro prodotto `e integrabile.
Definiamo allora il prodotto interno delle due funzioni fegponendo2
hf, gi=Zb
a
¯g(s)f(s) ds .
Si noti che se le funzioni prendono valori reali allora il segno di coniugio non ha alcun effetto;
se per`o esse prendono valori complessi il coniugio `e importante perch´e `e grazie ad esso che
si ottiene phf, f i=||f||2.
Quest’uguaglianza giustifica il termine prodotto interno (o prodotto scalare”): nel
caso dei “vettori ordinari” di R3si ha infatti
kxk=qx2
1+x2
2+x2
3=x·x.
Diciamo che due funzioni fegsono ortogonali in L2(a, b) quando
hf, gi= 0 .
Naturalmente, per dire che f`e ortogonale a g, scriveremo
fg .
Una propriet`a importante del prodotto interno in L2(a, b) `e che per esso vale il teorema di
Pitagora:
Teorema 48 Se fgallora ||f+g||2=||f||2+||g||2.
Dim.Infatti si ha
||f+g||2=hf+g, f +gi=hf, fi+hf, gi+hg, f i+hg, gi=||f||2+||g||2.
In particolare,
fg= ||f|| ||f+g||,||g|| ||f+g||.
Osservazione 49 Va notato esplicitamente che non esiste nessun concetto analogo a quello
di prodotto interno per le distanze in C(a, b) o di L1(a, b).
2si pu`o mostrare che le propriet`a essenziali di questo prodotto mimano quelle del prodotto
scalare di vettori di Rno di Cn.
2.2. DISTANZE TRA FUNZIONI 39
2.2.2 Propriet`a della convergenza uniforme
La sola convergenza puntuale `e troppo debole per avere propriet`a importanti di qualche
tipo. Infatti:
esistono successioni di funzioni integrabili che convergono puntualmente a funzioni
non integrabili.
Per vedere un esempio, ricordiamo che i numeri razionali sono numerabili, ossia sono imma-
gine di una successione iniettiva. Sia (qk) questa successione e definiamo la funzione
fn(x) = 1 se x=q1, q2,...,qn
0 altrimenti .
Ciascuna delle funzioni fn(x) `e integrabile, con integrale uguale a zero, perch´e fn(x) `e zero
salvo che in un numero finito di punti.
La successione (fn(x)) converge alla funzione di Dirichlet, che vale 1 sui razionali e
vale 0 sugli irrazionali. Questa funzione non `e integrabile.
esistono successioni di funzioni continue che convergono puntualmente a funzioni
discontinue.
Un esempio `e il seguente: sia I= [0,1] e sia fn(x) = xn. Ciascuna funzione `e continua, ma
la successione di funzioni (fn(x)) converge puntualmente su Ialla funzione
f(x) = 0 se x[0,1)
1 se x= 1 .
Questa funzione `e discontinua.
E’ per questa ragione che vanno introdotti concetti pi`u restrittivi di convergenza. In que-
sto paragrafo presentiamo le relazioni tra il concetto di convergenza uniforme e le propriet`a
di limite, derivabilit`a ed integrazione3.
Il teorema centrale `e il seguente:
Teorema 50 Sia (fn(x)) una successione di funzioni, definite su un intervallo I, ciascuna
delle quali `e continua in un punto x0. Se la successione converge ad una funzione f(x)
uniformemente su Iallora anche la funzione f(x)`e continua in x0.
Omettiamo la dimostrazione.
Ricordando che le funzioni continue su un intervallo limitato e chiuso sono integrabili si
ha:
Corollario 51 Sia (fn(x)) una successione di funzioni continue su un intervallo limitato
e chiuso I. La successione converga uniformemente su Iad una funzione f(x). Allora, la
funzione f(x)`e continua e quindi anche integrabile su I.
Sotto le ipotesi del corollario precedente, pu`o dirsi di pi`u: l’integrale di f(x)`e il limite degli
integrali delle fn(x).Ossia:
3invece, non illustreremo le relazioni tra tali propriet`a e le convergenze in media, che
richiederebbero l’introduzione di concetti di integrale pi`u generali di quello di Riemann.
40 CAPITOLO 2. SUCCESSIONI E SERIE DI FUNZIONI
Teorema 52 Sia (fn(x)) una successione di funzioni continue su un intervallo limitato e
chiuso I. La successione converga uniformemente su Iad una funzione f(x). Allora,
ZI
f(x)dx=ZIlim
n+fn(x)dx= lim
n+ZI
fn(x)dx.(2.1)
Dim.Ricordando la definizione di limite, dobbiamo provare che per ogni ǫ > 0esiste Nǫ
tale che per ogni n > Nǫsi ha
ZI
f(x) dxZI
fn(x) dx
< ǫ .
Dalla linearit`a e dalla propriet`a di monotonia degli integrali,
ZI
f(x) dxZI
fn(x) dxZI|fn(x)f(x)|dx
e quindi basta provare che
ZI|fn(x)f(x)|dx < ǫ
per nsufficientemente grande.
Ricordiamo che la successione (fn(x)) converge ad f(x)uniformemente su I: scelto un
qualunque σ > 0 esiste ˜
Nσtale che, per ogni n > ˜
Nσsi ha
|fn(x)f(x)|< σ xI
e quindi anche
ZI|fn(x)f(x)|dx < σL
con Lla lunghezza di I. L’asserto segue scegliendo σ=ǫ/L eNǫ=˜
Nǫ/L.
Osservazione 53 Ricordiamo, dall’Osservazione 46, che se I=I1I2e se la successione
(fn) converge uniformemente su I, essa converge uniformemente sia su I1che su I2. D’altra
parte, l’integrale su I=I1I2`e la somma dei due integrali su I1e su I2. Quindi il teorema
si applica facilmente anche a successioni uniformemente convergenti di funzioni continue a
tratti e questo `e sufficiente per molte applicazioni. Si potrebbe per`o provare che la semplice
integrabilit`a di ciascuna delle funzioni fn(x) e la convergenza uniforme della successione ad
f(x) implica che la f(x) `e integrabile e che vale l’uguaglianza (2.1).
Sia Fn(x) primitiva di fn(x). La convergenza della successione (fn)non implica la
convergenza della successione (Fn). Questo si vede facilmente scegliendo fn(x) = 0 per ogni
x, ed Fn(x) = nper ogni x. Le cose cambiano se si assegna il comportamento che le Fn(x)
devono avere in un medesimo punto x0:
Teorema 54 Sia (fn(x)) una successione di funzioni continue su un intervallo [a, b]e sia
Fn(x) = cn+Zx
a
fn(s)ds .
2.2. DISTANZE TRA FUNZIONI 41
Supponiamo che
lim
ncn=c0,
e che la successione (fn) converga uniformemente ad f0. In tal caso la successione (Fn)
converge uniformemente alla funzione
F0(x) = c0+Zx
a
f0(s)ds .
Dim. Ricordiamo che la funzione f0(x) `e continua, come limite uniforme di una successione
di funzioni continue. Dunque l’espressione proposta per F0(x) ha senso.
La differenza |Fn(x)F0(x)|si stima cos`ı:
|Fn(x)F0(x)| |cnc0|+Zx
a|fn(s)f0(s)|ds |cnc0|+Zb
a|fn(s)f0(s)|ds .
La successione numerica (|cnc0|) tende a zero per ipotesi, mentre la successione numerica
(Zb
a|fn(s)f0(s)|ds)
tende a zero per il Teorema 52. L’asserto segue quindi dal Lemma 47.
Vediamo ora le relazioni tra derivazione e convergenza uniforme. E’ facile trovare esempi
che mostrano che il limite uniforme di una successione di funzioni derivabili pu`o non essere
derivabile.
Esempio 55 Consideriamo la successione di funzioni
fn(x) = |x|se |x|>1/n
n
2x2+1
2naltrimenti .
Ciascuna di queste funzioni `e derivabile ma la successione di funzioni converge uniforme-
mente alla funzione non derivabile f(x) = |x|. Il grafico di alcune di queste funzioni `e in
figura 2.4.
Vale per`o:
Teorema 56 Sia (fn)una successione di funzioni derivabili su un intervallo (a, b). Suppo-
niamo che:
esista un punto x0tale che la successione numerica (fn(x0)) converga;
la successione (f
n(x)) converga uniformemente su Iad una funzione h(x).
In tal caso la successione (fn) converge uniformemente su Iad una funzione f(x)che `e
derivabile, ed inoltre f(x) = h(x); ossia
f(x) = lim
n+f
n(x).
Dim. Per ipotesi,
fn(x) = fn(x0) + Zx
x0
f
n(s) ds .
L’asserto segue quindi dal Teorema 54.
42 CAPITOLO 2. SUCCESSIONI E SERIE DI FUNZIONI
Figura 2.4: La convergenza uniforme non implica la convergenza della
successione delle derivate
−2 −1.5 −1 −0.5 0 0.5 1 1.5 2
0
0.2
0.4
0.6
0.8
1
1.2
1.4
1.6
1.8
2
2.3 Serie di funzioni
Le serie di funzioni si definiscono in modo del tutto analogo alle serie numeriche: se (fn)
´e una successione di funzioni, la serie corrispondente si indica col simbolo
X
n
fnoppure X
n
fn(x).
Se ´e necessario indicare i valori presi dall’indice scriveremo per esempio
+
X
n=n0
fn.
Il significato del simbolo di serie ´e il seguente: supponendo che l’indice prenda tutti i valori
maggiori od uguali a 0, si costruisce la nuova successione
s0(x) = f0(x), s1(x) = f0(x) + f1(x), sn(x) = f0(x) + f1(x) + ···+fn(x).
Se la successione di funzioni (sn(x)) converge uniformemente, si dice che la serie converge
uniformemente; se la successione di funzioni (sn(x)) converge in L1oppure in L2, si dice
che la serie converge in tal senso.
Enunciamo il teorema seguente, senza dimostrarlo:
Teorema 57 Sia convergente la serie di numeri positivi
Xγn.
Valga inoltre
dp(fn,0) γn
ove p= +oppure p= 1oppure p= 2. Sotto queste ipotesi, esiste una funzione g(x)
(rispettivamente in C(I),L1(I)oppure L2(I)) tale che la serie
Xfn
2.3. SERIE DI FUNZIONI 43
converge nel senso corrispondente a g(x).
Sia Pfnuna serie di funzioni. Si dice che questa serie converge normalmente (in
C(I) oppure in Lp(I)) quando converge la serie
X||fn||p
(con puguale a 1, 2). L’asserto del teorema precedente si esprime anche dicendo che una
serie che converge normalmente `e anche una serie convergente. Il viceversa non vale.
Nel caso di p= +, ossia per la convergenza uniforme, il test per la convergenza dato
nel Teorema 57 si chiama anche test di Weierstrass .
A parte questo teorema, di dimostrazione difficile, i teoremi visti per la convergenza
delle successioni di funzioni si adattano facilmente allo studio della convergenza delle serie.
Enunciamo in particolare:
Teorema 58 Una serie di funzioni continue Pfnconverga uniformemente su Iad una
funzione f(x). Allora la funzione f(x)`e continua e, se I`e limitato e chiuso, vale
ZI"X
n
fn(x)#dx=X
nZI
fn(x)dx.
Sia Pnfn(x)una successione di funzioni derivabili, convergente puntualmente su Iad una
funzione f(x). Supponiamo che la serie Pnf
n(x)converga uniformemente su Iad una
funzione g(x). Allora la funzione f(x)`e derivabile, con derivata f(x) = g(x)ed inoltre la
serie Pnfn(x)converge ad f(x) uniformemente su I.
Esempio 59 Consideriamo la serie
+
X
n=0
x(1 x)n, x [0,1] .
Questa serie converge puntualmente su [0,1]. ossia converge per ogni x[0,1]. Infatti, se
x= 0 ogni termine della serie `e nullo e quindi la somma della serie `e 0; se x(0,1] allora `e
lecito scrivere
+
X
n=0
x(1 x)n=x +
X
n=0
(1 x)n!=x1
1(1 x)= 1 .
Dunque, si ha
+
X
n=0
x(1 x)n=0 se x= 0
1 altrimenti.
Dunque la somma della serie non `e continua e quindi la serie, pur convergendo puntualmente
su [0,1], non converge uniformemente.
44 CAPITOLO 2. SUCCESSIONI E SERIE DI FUNZIONI
2.4 Serie di potenze
Si chiamano serie di potenze le serie di funzioni della forma
+
X
n=0
an[xx0]n,(2.2)
ottenute a partire dalla successione di monomi an[xx0]n.
Si noti che il primo valore dell’indice `e ora n= 0 ma niente vieta che sia a0= 0 ossia
che la serie “parta” per esempio con indice 1.
Se esiste Ntale che an= 0 per n > N, allora la serie di potenze si riduce ad un
polinomio: le serie di potenze generalizzano i polinomi.
Il numero x0si chiama il centro della serie e la serie di potenze converge sempre per
x=x0(e ivi converge ad a0). Potrebbe non convergere in nessun altro punto.
Esempio 60 Si consideri la serie seguente, di centro x0= 0:
+
X
n=0
nnxn=
+
X
n=0
(nx)n.
Si fissi il valore di x6= 0 e sia n0tale che |n0x|>1. Allora, per n > n0, si ha
|nx|n>|n0x|n+.
Dunque, se x6= 0, il termine generale della serie non tende a zero, e quindi la serie non
converge.
Vale per`o:
Teorema 61 ( Teorema di Abel )Una serie di potenze converga in un punto ξ6=x0e sia
r=|ξx0|>0.
Allora, la serie di potenze converge uniformemente in {x| |xx0|< r}per ogni r< r.
Dim.Si guardi la figura 2.5 per seguire questa dimostrazione.
Sia |xx0|< r< r e sia d(r, r) cos`ı che
r< r , r =|xξ|> d
e quindi
|an(xx0)n|<|an(ξx0)n| · r
|ξx0|n
|an(ξx0)n| · r
dn
.
La convergenza in ξimplica che la successione (|an(ξx0)n|) `e limitata (anzi tende a zero):
|an(ξx0)n|< M .
2.4. SERIE DI POTENZE 45
Figura 2.5: Gli intervalli che si usano nella dimostrazione del teorema di Abel
−1 0 1 2 3 4 5 6
−1
−0.8
−0.6
−0.4
−0.2
0
0.2
0.4
0.6
0.8
1
x0 ξ
r
r’
d
x
Inoltre,
r
d< q < 1.
Dunque, per |xx0|< rsi ha
|an(xx0)n| γn, γnMqn
con 0 q < 1 e quindi con Pγn<+. La convergenza uniforme segue dal criterio di
Weierstrass, Teorema 57.
Questo risultato in particolare implica che se una serie di potenze converge allora l’insie-
me su cui essa converge `e un intervallo centrato in x0(e non si esclude che sia ridotto al solo
x0, oppure che sia tutta la retta). Questo si chiama l’ intervallo di convergenza della serie
di potenze e si chiama raggio di convergenza la sua semiampiezza. Il raggio di convergenza
pu`o essere nullo, si veda l’esempio 60. Pu`o essere un numero finito non nullo oppure pu`o
essere +: `e un numero finito non nullo nel caso particolare della serie geometrica, `e +
nel caso in cui la serie di potenze si riduca ad un polinomio, ma non solo in tal caso:
Osservazione 62 Consideriamo la serie
+
X
n=0
xn
n!.
Fissato x, si trova una serie numerica, convergente per ogni valore del parametro x, come
si vede facilmente usando il criterio del rapporto.
46 CAPITOLO 2. SUCCESSIONI E SERIE DI FUNZIONI
Inoltre, la dimostrazione del Teorema 61 mostra che:
Teorema 63 ( Teorema di Abel )Sia 0R+il raggio di convergenza di una serie
di potenze e sia xtale che |xx0|< R. La serie di potenze converge assolutamente e quindi
incondizionatamente nel punto x.
Ci`o mostra che l’ordine dei termini di una serie di potenze non influisce sulla somma della
serie nei punti interni all’intervallo di convergenza. Invece, niente pu`o dirsi in generale del
comportamento della serie negli estremi dell’intervallo di convergenza, come mostrano gli
esempi seguenti.
Esempio 64 Consideriamo la serie di potenze
+
X
n=1
(1)2xn
n(2.3)
Fissato xsi trova una serie numerica e si vede facilmente, dal criterio del rapporto, che la
sere converge per ogni xcon |x|<1, diverge se |x|>1. Dunque il raggio di convergenza `e
1. Se x=1 oppure x= +1 si trovano rispettivamente le due serie
+
X
n=1
1
n,
+
X
n=1
(1)n1
n.
La prima divergente e la seconda convergente.
Si `e detto che la somma di una serie di potenze non dipende dall’ordine degli elementi nei
punti interni dell’intervallo di convergenza. Quest’esempio mostra che, invece, pu`o dipendere
dall’ordine degli elementi se x`e uno degli estremi dell’intervallo di convergenza.
Mostriamo ora una serie di potenze che converge in ambedue gli estremi dell’intervallo
di convergenza. La serie `e
+
X
n=1
1
n2x2n.(2.4)
Di nuovo, fissato x, si usi il criterio del rapporto per studiare la convergenza della serie
numerica che si ottiene. Si vede che si ha convergenza per 1x1, estremi inclusi,
mentre la serie diverge per |x|>1.
Infine, mostriamo una serie di potenze che diverge in ambedue gli estremi dell’intervallo
di convergenza. Questa `e la serie
+
X
n=0
(1)nx2n.(2.5)
Questa `e una serie geometrica di ragione x2e quindi converge se e solo se 1< x < 1,
estremi esclusi.
Si noti che la somma di questa serie `e la funzione
f(x) = 1
1 + x2,
una funzione di classe C(R). La ragione per cui la serie corrispondente non debba
convergere negli estremi sembra misteriosa, e verr`a chiarita al paragrafo 2.4.2.
2.4. SERIE DI POTENZE 47
E’ interessante vedere i grafici di alcune delle somme parziali delle tre serie introdotte
sopra. L’intervallo di convergenza delle serie `e (1,1). I grafici delle somme parziali sono
disegnati su un intervallo un po’ pi`u grande e, punteggiato, si riporta anche il grafico della
somma della serie, ovviamente solo sull’intervallo (1,1). La prima e la seconda serie sono
alla figura 2.6 L’ultima serie `e alla figura 2.7. Il grafico punteggiato (tratto spesso) in
Figura 2.6: Somme parziali dellaserie (2.3) (a sinistra e della serie (2.4) (a
destra)
−1.5 −1 −0.5 0 0.5 1 1.5
−5
−4
−3
−2
−1
0
1
2
y
x
−1
1
−1.5 −1 −0.5 0 0.5 1 1.5
−0.5
0
0.5
1
1.5
2
2.5
3
Figura 2.7: Somma parziali della serie (2.5)
−1.5 −1 −0.5 0 0.5 1 1.5
−1.5
−1
−0.5
0
0.5
1
1.5
2
2.5
3
x
y
−1 1
questo caso rappresenta la funzione 1/(1 + x2), che `e la somma della serie sul solo intervallo
(1,1). E’ stato disegnato in un intervallo pi`u grande per sottolineare che la questa funzione
`e regolare anche nei punti +1 e 1.
Inoltre, la convergenza essendo uniforme, dal Teorema 50:
48 CAPITOLO 2. SUCCESSIONI E SERIE DI FUNZIONI
Corollario 65 La somma di una serie di potenze `e continua nei punti interni all’intervallo
di convergenza.
Si potrebbe inoltre provare che:
Teorema 66 Sia Ril raggio di convergenza della serie Pan(xx0)n. Le due serie di
potenze
Xd
dx[an(xx0)n] = Xnan(xx0)n1,
XZx
x0
an(sx0)nds=X1
n+ 1 an(xx0)n+1 (2.6)
hanno lo stesso raggio di convergenza e questo `e uguale ad R.
Le due serie in (2.6) si dicono ottenute derivando termine a termine ointegrando termine a termine
la serie data. Esse convergono uniformemente in [a, b](x0R, x0+R) e quindi, usando
i teoremi 52 e 56, si trova l’uguaglianza
d
dxhXan(xx0)ni=Xnan(xx0)n1,
Zx
0hXan(xx0)ni=X1
n+ 1an(xx0)n+1 .
In particolare quindi anche la serie derivata pu`o a sua volta venir derivata termine a
termine e ci`o tante volte quante si vuole. Dunque:
Corollario 67 La somma di una serie di potenze di raggio di convergenza non nullo `e una
funzione di classe Cnell’intervallo di convergenza.
Chiediamoci ora come sia possibile calcolare il raggio di convergenza di una serie di
potenze. Esiste una formula per il raggio di convergenza, che non possiamo presentare.
Possiamo per`o presentare due test particolari, che si ottengono per confronto con la serie
geometrica. Il primo si pu`o applicare quando si ha an6= 0 per ogni n(e basta che questa
condizione sia soddisfatta per nmaggiore di un opportuno N0).
Teorema 68 Supponiamo che an6= 0 per ogni ne che esista, finito o meno,
L= lim |an+1|
|an|.
Allora il raggio di convergenza della serie `e
0 se L= +
1
Lse 0 < L < +
+se L= 0 .
Dim.Limitiamoci a considerare il caso 0 < L < +. Applichiamo il criterio del rapporto
per la convergenza della serie di numeri
Xan[xx0]n,
2.4. SERIE DI POTENZE 49
con xfissato. Il criterio del rapporto asserisce che condizione sufficiente di convergenza `e che
per nsufficientemente grande valga
|an+1[xx0]n+1|
|an[xx0]n|=|an+1|
|an||xx0|< q < 1.(2.7)
La serie diverge se vale la disuguaglianza opposta, con q > 1.
Proviamo che si ha convergenza se
|xx0|<1
Lossia se L|xx0|<1 (disuguaglianze strette).
In tal caso, ˜q[0,1) tale che
L|xx0|= ˜q < 1 e quindi lim |an+1|
|an||xx0|=L|xx0|= ˜q < 1.(2.8)
Sia q(˜q, 1). Il teorema di permanenza del segno mostra l’esistenza di un numero Ntale
che per ogni n > N vale
|an+1|
|an||xx0|< q .
Essendo q(0,1), la serie converge (si ricordi (2.7)).
In modo analogo si trattano gli altri casi.
Ripetiamo che il teorema precedente non pu`o usarsi se infiniti coefficienti ansono nulli.
Usando il criterio della radice invece del criterio del rapporto si prova invece:
Teorema 69 Se esiste, finito o meno, il limite
lim n
p|an|=L
allora il raggio di convergenza `e
R=
0 se L= +
1/L se 0 < L < +
+se L= 0 .
Si noti che il Teorema 69 pu`o usarsi anche se infiniti coefficienti ansono nulli. Mostriamo
ora che esistono serie di potenze il cui raggio di convergenza non pu`o determinarsi e col
criterio del rapporto e con quello della radice4
Esempio 70 Si consideri la serie
+
X
n=0
2(1)nnxn.
E’
n
p|an|=2 se n`e pari
1
2se n`e dispari.
4nella forma enunciata sopra. Il criterio della radice pu`o modificarsi in modo da avere
un nuovo criterio, che identifica in raggio di convergenza in ogni caso.
50 CAPITOLO 2. SUCCESSIONI E SERIE DI FUNZIONI
Quindi,
lim n
p|an|non esiste .
E’:
an+1
an
=2(1)n+1(n+1)
2(1)nn=22n+1 se n`e pari
22n1se n`e dispari
e quindi
lim an+1
an
non esiste.
In casi di questo tipo, conviene considerare xcome una parametro e studiare la convergenza
della serie numerica ottenuta, per ogni valore di x. Usando il criterio della radice per ogni
xfissato, si vede che
n
p|anxn|< q < 1
se 2x < q e quindi se x < q/2, per qualche q < 1. Dunque il raggio di convergenza `e almeno
1/2. D’altra parte, se |x|>1/2 allora per n= 2k, pari, si trova
a2kx2k= (2x)2k+.
Quindi, il termine generale non tende a zero e la serie non converge. Quindi, il raggio di
convergenza `e uguale ad 1/2.
2.4.1 Operazioni sulle serie di potenze
Le operazioni sulle serie di potenze si eseguono con le regole delle operazioni sulle serie
numeriche, per ogni fissato valore del parametro x. Ci interessa per`o notare esplicitamente:
Somma di serie Siano Pan(xx0)n,Pbn(xx0)ndue serie di potenze col
medesimo centro x0e con raggio di convergenza rispettivamente Raed Rb. Sia
R= min{Ra, Rb}.
Allora, ambedue le serie convergono per |xx0|< R e quindi la loro somma pu`o scriversi
nuovamente come serie di potenze di centro x0, convergente per |xx0|< R:
hXan(xx0)ni+hXan(xx0)ni=X[an+bn](xx0)n.
Il raggio di convergenza della serie somma pu`o essere maggiore di R. Per esempio, se
bn=an, allora la serie somma ha raggio di convergenza +anche se R < +. Ci`o per`o
pu`o aversi solamente se R1=R2. Infatti, se per esempio R1< R2allora R=R1. Infatti,
scrivendo Xanxn=hX(an+bn)xni+hX(bn)xni
si vede che il raggio di convergenza della prima serie `e almeno uguale a
min{R, R2}
e questo sarebbe maggiore di R1se fosse R > R1.
L’operazione di somma pu`o usarsi anche “al contrario” per calcolare il raggio di conver-
genza in certi casi nei quali falliscono sia il criterio del rapporto che quello della radice:
2.4. SERIE DI POTENZE 51
Esempio 71 Torniamo a considerare la serie vista all’esempio 70. La serie di quest’esempio
si pu`o vedere come somma delle due serie
hXanxni+hXbnxni, an=2nn pari
0 altrimenti bn=0 n pari
2naltrimenti .
Ora, rinominando 2kl’indice ndella prima serie, si trova
X22k[x2]k.
Sostituendo t=x2si trova la serie di potenza
X22ktk,
a cui si pu`o applicare sia il criterio del rapporto che quello della radice. Il raggio di conver-
genza `e 4 per la serie della variabile t, e quindi 2 per la serie della variabile x. Analogamente,
la seconda serie converge per |x|<1/2. Dunque, il raggio di convergenza della serie somma
`e esattamente 1/2.
Unicit`a della serie di potenze Mostriamo che la serie di potenze che converge
ad una funzione f(x), se esiste, `e unica:
Teorema 72 Siano +
X
n=0
an(xx0)n,
+
X
n=0
bn(xx0)n
due serie di potenze con raggio di convergenza rispettivamente R1>0ed R2>0. Sia
0< R < min{R1, R2}. Se
+
X
n=0
an(xx0)n=
+
X
n=0
bn(xx0)n
per ogni xcon |xx0|< R allora an=bnper ogni ne quindi R1=R2.
Dim.Basta provare che se
+
X
n=0
(anbn)(xx0)n= 0
per |xx0|< R allora anbn= 0. Posto x=x0si trova infatti a0b0= 0 e quindi
l’uguaglianza precedente si scrive
0 =
+
X
n=1
(anbn)(xx0)n= (xx0)
+
X
n=1
(anbn)(xx0)n1.
Dunque si ha anche
+
X
n=1
(anbn)(xx0)n1= 0 .
Calcolando per x=x0si vede a1b1= 0 e dunque
+
X
n=2
(anbn)(xx0)n1= 0 .
Il procedimento pu`o quindi ripetersi trovando a2b2= 0, e cos`ı via.
52 CAPITOLO 2. SUCCESSIONI E SERIE DI FUNZIONI
Prodotto alla Cauchy di serie di Potenze Consideriamo le due serie di
potenze col medesimo centro x0
+
X
n=0
an(xx0)n,
+
X
k=0
bk(xx0)k.
Calcoliamo tutti i possibili prodotti di un termine della prima con un termine della seconda
e raccogliamo i coefficienti dei termini con la medesima potenza (xx0)r. Si trova (xx0)r
quando si fa il prodotto di bk(xx0)kcon tutti i termini della forma
ark(xx0)rk.
Ossia, il coefficiente di (xx0)rviene ad essere
r
X
k=0
bkark.
Ci`o suggerisce la definizione di prodotto alla Cauchy , definito da
"+
X
n=0
an(xx0)n#"+
X
k=0
bk(xx0)k#=
+
X
r=0 "r
X
k=0
bkark#(xx0)r.
E’ appena il caso di notare che il “nome“ degli indici non ha effetto sulla somma della serie.
Si sono usati “nomi diversi (n,ked r) solo per chiarezza.
Il teorema che si pu`o provare `e il seguente:
Teorema 73 Due serie di potenze abbiamo raggio di convergenza rispettivamente r1ed r2
coan r1r2. La serie prodotto alla Cauchy ha raggio di convergenza almeno uguale ad r1.
Osservazione 74 Consideriamo l’esempio seguente:
"+
X
n=0
x2n#·"+
X
k=0
x5k#
Il prodotto alla Cauchy contiene potenze xrsolo se rpu`o scriversi nella forma
r= 2n+ 5k
per certi valori di nek. Il coefficiente di questa potenza `e la somma di tanti numeri 1 quanti
sono i modi di scrivere rin tale forma.
Ma ora,
+
X
n=0
x2n=1
1x2,
+
X
k=0
x5k=1
1x5
e il loro prodotto `e
1
1x2x5+x7.
2.4. SERIE DI POTENZE 53
Vedremo, al paragrafo 2.4.3, un modo diverso per rappresentare questa funzione come som-
ma di una serie di potenze, che calcola i coefficienti della (unica!) espansione in serie di
potenze facendo derivate. precisamente vedremo che il coefficiente crdi xr`e
cr=1
r!Dr
x0=0 1
1x2x5+x7.
In questo modo, dato r, si calcola facilmente in quanti modi questo si pu`o rappresentare
come somma di tante “monete” di valore 2 e tante “monete” di valore 5.
2.4.2 Serie di potenze nel campo complesso
Le operazioni algebriche e le operazioni di limite possono anche calcolarsi tra numeri com-
plessi. Quindi, le serie di potenze possono trattarsi anche nel campo complesso. Il Teore-
ma 61 e il Teorema 63 si riformulano come segue:
Teorema 75 ( Teorema di Abel )Una serie di potenze
Xan(zz0)n,
nel campo complesso, converge sempre nel punto z0. Se converge anche in altri punti, allora
essa converge in un disco aperto di centro z0e raggio R > 0(si scrive R= +se la serie
converge per ogni z).
La convergenza `e uniforme in ogni disco di centro z0e raggio R0< R; `e assoluta in
ciascun punto zinterno al disco di convergenza.
Per convergenza assoluta nel caso di serie di potenze a valori complessi, si intende la
convergenza della serie5
X|an| · |zz0|n.
La dimostrazione `e del tutto analoga a quella vista per le serie di potenze reali. Per`o, ora
pu`o mostrarsi di pi`u: sia f(z) la somma di una serie di potenze di raggio di convergenza R.
Esiste almeno un punto z1tale che |z1z0|=R, nel quale la funzione f(z)non `e regolare.
Ci`o chiarisce la stranezza notata all’Esempio 64. Per |x|<1 vale
1
1 + x2=
+
X
n=0
(1)nx2n
e la funzione 1/(1+x2) `e di classe C(R). Non si vede quindi quale fenomeno possa bloccare
la convergenza della serie. Se per`o la serie si legge nel campo complesso, allora
1
1 + z2=
+
X
n=0
(1)nz2n
e la funzione 1/(1 + z2) non `e definita nei punti ±i, che distano 1 dal centro della serie.
5ora | · | indica il modulo dei numeri complessi.
54 CAPITOLO 2. SUCCESSIONI E SERIE DI FUNZIONI
2.4.3 Serie di Taylor
Sia f(x) una funzione di classe Cin un intorno di x0. Ad essa pu`o associarsi la serie di
Taylor
+
X
n=0
1
n!f(n)(x0)[xx0]n.
Questa si chiama la serie di Taylor della funzione f. Questa serie pu`o non convergere e, se
converge, pu`o non convergere alla funzione f, come mostra l’esempio seguente:
Esempio 76 Sia
f(x) = e1/x2se x6= 0
0 se x= 0 .
Questa funzione `e di classe Csu Re le sue derivate in x0= 0 sono tutte nulle. Dunque la
serie di Taylor di centro 0 associata ad f(x) ha tutti i coefficienti nulli: converge su Ralla
funzione identicamente zero e non ad f.
Ci possiamo chiedere quindi sotto quali condizioni la serie di Taylor di feffettivamente
converga ad f. Scrivendo la formula di Taylor di f(x) arrestata all’ordine ke col resto in
forma di Lagrange, si vede che
f(x) =
k
X
n=0
1
n!f(n)(x0)[xx0]n+1
(k+ 1)!f(k+1)(sk)[xx0]k+1
dove skdipende da ked `e compreso tra x0ed x. La serie di Taylor converge ad fquando
il resto converge a zero. Una condizione perch´e ci`o accada `e:
Teorema 77 Esistano M,Ltali che
|f(k)(x)|< MLkx[x0r, x0+r].
La serie di Taylor di f(x)converge su [x0r, x0+r]e converge alla funzione f(x).
Dim.Ricordiamo che per ogni xsi ha
lim
n+
xn
n!= 0 .
Si osservi ora che
1
(k+ 1)! f(k+1)(sk)[xx0]k+1< M (Lr)k+1
(k+ 1)! .
Il membro destro tende a zero e quindi, per il criterio del confronto, tende a zero uniforme-
mente anche l’errore
f(x)
k
X
n=0
1
n!f(n)(x0)[xx0]n
=1
(k+ 1)! f(k+1)(sk)[xx0]k+1.
La condizione del Teorema 77 `e soddisfatta nel caso delle funzioni di cui correntemente si
usano gli sviluppi di Taylor, almeno su un opportuno intervallo. La tabella seguente riporta
alcune funzioni e il raggio di convergenza della relativa serie di McLaurin (ossia, della serie
di Taylor di centro 0).
2.4. SERIE DI POTENZE 55
Funzione Raggio di conv. Serie
ex+P
n=0 xn
n!
sin x+P+
n=0(1)nx2n+1
(2n+1)!
cos x+P+
n=0(1)nx2n
(2n)!
sinh x+P+
n=0 x2n+1
(2n+1)!
cosh x+P+
n=0 x2n
(2n)!
log(1 + x) 1 P+
n=1(1)n+1 xn
n
(1 + x)α1P+
n=0 α
nxn
Infine, studiamo la relazione tra parit`a di una funzione e sua serie di Taylor. Vale:
Teorema 78 Sia
f(x) =
+
X
n=0
anxn.
La funzione `e pari se e solo se sono nulli i coefficienti andi indice dispari; la funzione `e
dispari se e solo se sono nulli i coefficienti andi indice pari.
Dim.Sia f(x) sviluppabile in serie di Taylor. Se `e dispari, essa si annulla in 0. Dunque
a0= 0. La sua derivata prima `e pari ma la derivata seconda `e dispari e quindi f′′(0) = 0
ossia vale anche a2= 0. Iterando questo procedimento si vede che ogni a2k`e nullo.
Se f(x) `e pari, sono dispari tutte le sue derivate di ordine dispari e quindi sono nulli gli
a2k+1.
Il viceversa `e ovvio.
2.4.4 Serie di potenze ed equazioni differenziali lineari
Consideriamo il problema di Cauchy
x=ax , x(0) = x0.
Il coefficiente a`e costante. Per definizione, la soluzione x`e continua e quindi, dall’ugua-
glianza, `e addiritture continuamente derivabile; e quindi
x′′ =ax=a2x .
Cos`ı proseguendo,
x(n)=anx
e quindi, per t= 0,
x(n)(0) = anx0.
Dunque, la soluzione x(t) `e di classe Ce verifica le condizioni del Teorema 77 su tutti gli
intervalli chiusi contenenti x0. Dunque, la soluzione si esprime in forma di serie di potenze
x(t) =
+
X
n=0
1
n!antn
56 CAPITOLO 2. SUCCESSIONI E SERIE DI FUNZIONI
D’altra parte si verifica immediatamente che questa `e la serie dell’esponenziale e quindi si
ritrova il risultato noto
x(t) = eatx0.
Consideriamo ora il sistema di equazioni differenziali lineari
x=Ax(2.9)
ove x`e un vettore di Rned A`e una matrice n×nche `e costante, ossia non dipende e
da tn´e da x. Vogliamo rappresentare la soluzione di questo sistema che verifica l’ulteriore
condizione
x(t0) = x0.
E’ facile vedere che tutto ci`o che abbiamo detto sulle serie di potenze e sulle serie di
Taylor si estende senza cambiamenti a funzioni a valori vettori o matrici e quindi `e ancora
vero che
x(t) = +
X
n=0
1
n!An(tt0)n!x0.
Questa serie si indica col simbolo
eA(tt0)=
+
X
n=0
1
n!An(tt0)n.(2.10)
Ci`o definisce l’ esponenziale di una matrice , e la (2.10) rappresenta in forma compatta le
soluzioni dell’equazione differenziale lineare a coefficienti costanti (2.9):
Osservazione 79 Va notato un fatto importante: l’esponenziale di matrice pu`o essere un
polinomio. Per esempio, se
A=0 1
0 0
allora A2= 0 e quindi
eAt =1t
1 0 :
eAt `e un polinomio di primo grado. Si prova invece che se
A=0 1
1 0
allora
eAt =cos tsin t
sin tcos t.
Propriet`a importanti della matrice esponenziale eAt sono espresse dal teorema seguente,
che non proviamo:
Teorema 80 Vale:
AeAt =eAtA.
2.5. SERIE DI FOURIER: INTRODUZIONE 57
det eA= exp{Pn
i=1 aii}.Dunque, det eA`e sempre diverso da zero: la matrice eA`e
invertibile per ogni A.
eA1=eA.
Se AB =BA allora eAeB=eA+B. In particolare, vale sempre eAteAt=eA(t+t).
La funzione teAt `e derivabile e
d
dteAt =AeAt .
L’introduzione dell’esponenziale eAt della matrice At permette anche di rappresentare
la soluzione del problema
x=Ax+f(t)x(t0) = x0.
Procediamo esattamente come gi`a si `e visto (nel corso di Analisi Matematica 1) per l’equa-
zione scalare: moltiplicando i due membri per eAt si trova
eAtx(t)AeAtx(t) = eAtf(t).(2.11)
La regola della derivata del prodotto si estende al prodotto di una matrice per un vettore6
e quindi la (2.11) `e
d
dteAtx(t)=eAtf(t).
Integrando i due membri da t0atsi trova
eAtx(t)eAt0x0=Zt
t0
eAsf(s) ds . (2.12)
Moltiplichiamo i due membri di (2.12) per eAt e usiamo le propriet`a nel teorema 80. Si trova
x(t) = eA(tt0)x0+Zt
0
eA(ts)f(s) ds .
2.5 Serie di Fourier: introduzione
Oltre alle serie di potenze, nelle applicazioni si incontrano molti altri tipo di serie di fun-
zioni”, la cui teoria comunque `e sostanzialmente pi`u complessa e viene qui esaminata per
sommi capi nel caso di gran lunga pi`u importante delle serie di Fourier.
Si chiamano serie di Fourier le serie del tipo
a0+
+
X
n=1 hancos nπ
Lx+bnsin nπ
Lxi.(2.13)
I coefficienti anebnsono reali.
Se L=πsi trova
a0+
N
X
n=1
[ancos nx +bnsin nx].
6con l’avvertenza di non commutare i fattori!
58 CAPITOLO 2. SUCCESSIONI E SERIE DI FUNZIONI
Si noti che, usando sin 0x= 0, si potrebbe assorbire il coefficiente a0nella serie scritta
con n0 invece che con n1. Vedremo che c’`e una buona ragione per separare a0dagli
ancon n > 0.
Ovviamente una serie di Fourier non sempre converge. La convergenza sar`a implicata
da opportune propriet`a dei coefficienti anebn. Per esempio, certamente si ha convergenza
(uniforme) quando an=bn=qn, con |q|<1. Il problema della convergenza puntuale o
uniforme delle serie di Fourier comunque `e assai delicato e lo illustreremo pi`u avanti. Per
ora notiamo che se la serie converge per un x0[L, L] allora essa converge in ogni punto
x0di forma x0+ 2kL con kintero; e se converge per ogni x[L, L] essa converge per ogni
xRe converge ad una funzione peridica di periodo T= 2L. Per questa ragione, prima di
studiare le serie di Fourier, vogliamo richiamare alcune propriet`a delle funzioni periodiche.
2.5.1 Premesse: le funzioni periodiche
Sia f(x) una funzione della variabile reale x. Si dice che f(x) `e periodica di periodo T
quando:
E’ T6= 0.
la funzione f(x) `e definita in x+Tse e solo se `e definita in x. E’ conseguenza di
questo che la funzione `e definita in x+nT (ove n`e intero qualsiasi) se e solo se `e
definita in x.
per ogni xnel dominio della funzione, si ha f(x) = f(x+T) e quindi anche f(x) =
f(x+nT ) per ogni numero intero n.
Teorema 81 Sia f(x)periodica di periodo Te sia Snumero reale. La funzione f(Sx)ha
periodo T/S. In particolare, se S=T /(2π), la funzione ha periodo 2π.
La verifica `e immediata:
f(S(x+T/S)) = f(T+Sx) = f(Sx).
Una funzione periodica non ha un solo periodo: se T`e un periodo anche 2T,T,2T
ecc. sono periodi. L’insieme dei periodi positivi ha per`o un estremo inferiore che pu`o essere
nullo7. Molto spesso, quando si parla di periodo” di una funzione periodica si intende
che esista un minimo periodo positivo, e per periodo si intende tale numero8. Se T`e il
(minimo) periodo di f(x), allora 1/T si chiama la frequenza di f(x) mentre 2π/T si chiama
la frequenza angolare di f(x).
Per esempio, le funzioni sin ωx e cos ωx sono funzioni periodiche di periodo 2π
ovunque definite mentre tan ωx `e una funzione di periodo π/ω, che per`o non `e ovunque
definita.
7L’estremo inferiore dei periodi pu`o essere nullo. Accade ci`o se la funzione `e costante,
ma non solo in tal caso. Per esempio, l’estremo inferiore dei periodi positivi `e nullo per la
funzione di Dirichlet.
8molto spesso, ma non sempre: si faccia attenzione al contesto!
2.5. SERIE DI FOURIER: INTRODUZIONE 59
Osservazione 82 Vediamo come i concetti precedenti si applicano alla serie di Fourier (2.13).
Le funzioni cos n(π/L)xe sin n(π/L)xhanno (minimo) periodo 2L/n e quindi tutti i termi-
ni della serie di Fourier hanno periodo (non necessariamente minimo) T= 2L.Per questa
ragione potremo limitarci a studiare la serie di Fourier sull’intervallo [L, L]o su un qualsiasi
altro intervallo di lunghezza 2L, per esempio [0,2L].
La frequenza di cos n(π/L)xe sin n(π/L)x`e n/2Lmentre la loro frequenza angolare `e
2π1
T=nπ
L:
il coefficiente di xnei due termini in posizione ndella serie di Fourier `e la frequenza angolare
/L.
Vale:
Teorema 83 Sia f(t)continua su Re periodica di periodo T. Per ogni xRsi ha
ZT
0
f(s)ds=Zx+T
x
f(s)ds , ZT
0
f(x+s)ds=ZT
0
f(s)ds .
Dim.Conviene provare la prima uguaglianza in due passi:
Passo 1. Proviamo che per ogni kintero si ha:
ZT
0
f(s) ds=Z(k+1)T
kT
f(s) ds;
ossia proviamo l’uguaglianza richiesta nel caso particolare x=kT . Per questo
sostituiamo s=kT +rnell’integrale a destra. Si trova
Z(k+1)T
kT
f(s) ds=ZT
0
f(kT +r) dr=ZT
0
f(r) dr .
L’ultima uguaglianza vale perch´e la funzione `e periodica di periodo Te quindi f(kT +
r) = f(r).
Passo 2. Consideriamo ora il caso generale
kT < x < (k+ 1)T < x +T .
Proviamo che vale
Zx+T
x
f(s) ds=Z(k+1)T
kT
f(s) ds .
Ci`o fatto, l’uguaglianza richiesta seguir`a dal passo 1.
Per capire questa parte del calcolo, si guardi la figura 2.8. Come suggerito dalla
figura, scriviamo
Zx+T
x
f(s) ds=Z(k+1)T
x
f(s) ds+Zx+T
(k+1)T
f(s) ds . (2.14)
60 CAPITOLO 2. SUCCESSIONI E SERIE DI FUNZIONI
La sostituzione s=T+rmostra che
Zx+T
(k+1)T
f(s) ds=Zx
kT
f(T+r) dr=Zx
kT
f(r) dr .
L’ultima uguaglianza vale perch´e f(x) `e periodica di periodo Te quindi f(r) =
f(T+r). Tornando alla (2.14) si vede che
Zx+T
x
f(s) ds=Z(k+1)T
x
f(s) ds+Zx
kT
f(r) dr=Z(k+1)T
kT
f(r) dr ,
come volevamo provare.
Figura 2.8: Illustrazione del Teorema 83
La seconda uguaglianza `e conseguenza della prima perch´e
ZT
0
f(x+s) ds=Zx+T
x
f(r) dr=ZT
0
f(r) dr .
Si noti che nel teorema precedente Tnon `e necessariamente il minimo periodo.
2.5.2 Premesse: le formule d’Eulero
Ricordiamo le formule d’Eulero, incontrate nello studio delle equazioni differenziali lineari:
eix = cos x+isin x
e quindi
eix = cos xisin x .
2.5. SERIE DI FOURIER: INTRODUZIONE 61
Osservazione 84 Le formule d’Eulero mostrano che la funzione xeix `e periodica di
periodo 2π. E’ anche vero che l’estensione della funzione esponenziale al piano complesso
ex+iy =ex(cos y+isin y)
`e periodica di periodo 2πi, ossia `e periodica quando il suo argomento si muove parallelamente
all’asse immaginario.
Sommando e sottraendo membro a membro, si trovano le uguaglianze
sin x=eix eix
2i,cos x=eix +eix
2.
Anch’esse vanno sotto il nome di formule d’Eulero . Sostituendo queste espressioni in
a0+
N
X
n=1
[ancos nx +bnsin nx]
si trova (si ricordi che i= 1/i)
a0+
N
X
n=1
anibn
2einx +
N
X
n=1
an+ibn
2einx =
N
X
n=N
cneinx
ove ora i cnsono i numeri complessi
c0=a0
cn=anibn
2se n > 0
cn=an+ibn
2se n < 0
(2.15)
e quindi tali che
cn= ¯cn.
Si osservi che anche in questa scrittura il termine con n= 0 ha un ruolo particolare: c0= ¯c0
`e reale.
Sostituendo in
a0+
N
X
n=1 hancos nπ
Lx+bnsin nπ
Lxi(2.16)
si trova N
X
n=N
cnein(π/L)x(2.17)
con i coefficienti cnancora dati da (2.15) e quindi con
cn= ¯cn,ec0= ¯c0.(2.18)
E’ facile vedere che si fa anche il passaggio inverso: se valgono le (2.18) allora nel-
la (2.17) i termini puramente immaginari si elidono e la somma (2.17) si riduce a (2.16), con
coefficienti reali.
62 CAPITOLO 2. SUCCESSIONI E SERIE DI FUNZIONI
Un’espressione della forma (2.17) si chiama un polinomio trigonometrico . Se valgono
le (2.18), il polinomio trigonometrico (2.17) si pu`o scrivere nella forma “reale” (2.16).
L’espressione (2.16) `e una somma parziale della serie di Fourier (2.13). Per questa
ragione, la serie di Fourier (2.13) si pu`o anche scrivere in “forma complessa”,
+
X
n=
cnein(π/L)x.(2.19)
Il fatto importante da ricordare `e che se vogliamo che questa serie corrisponda alla (2.13) le
somme parziali vanno prese in modo simmetrico: le somma parziali sono
N
X
n=N
cnein(π/L)x(2.20)
e non N
X
n=K
cnein(π/L)x(2.21)
con Ked Ntra loro indipendenti. E infatti pu`o accadere che per K −∞ ed N+,
indipendentemente, la (2.21) non ammetta limite nemmeno se (2.20) ammette limite per
N+.
Avremo bisogno di calcolare derivate e integrali di funzioni
f(x) + ig(x)
della variabile reale x, a valori numeri complessi. Per definizione,
d
dx[f(x) + ig(x)] = f(x) + ig(x),Zb
a
[f(x) + ig(x)] dx=Zb
a
f(x) dx+iZb
a
g(x) dx
e quindi
Zb
a
d
dx[f(x) + ig(x)] dx= [f(b) + ig(b)] [f(a) + ig(a)] .
Essendo d
dxeinx =ineinx ,
si trova:
Zπ
π
cos nx cos mx dx=
2πse n=m= 0
0 se n6=m
πse n=m6= 0
Zπ
π
sin nx cos mx dx= 0 per ogni n,m.
Zπ
π
sin nx sin mx dx=0 se n6=m
πse n=m
(2.22)
Per verificare la prima delle uguaglianze precedenti (con n6=m) calcoliamo, usando le
formule d’Eulero
Zπ
π
cos nx cos mx dx=1
4Zπ
πeinx +einxeimx +eimxdx
=1
4Zπ
πhei(n+m)x+ei(nm)x+ei(n+m)x+ei(nm)xidx .
2.6. LA SERIE DI FOURIER IN L2(L, L) 63
L’asserto ora segue perch`e, essendo per esempio
d
dxei(n+m)x=i(n+m)ei(n+m)x,
si ha
Zπ
π
ei(n+m)xdx=1
i(n+m)hei(n+m)πei(n+m)πi=2
n+msin((n+m)π) = 0 .
Le altre uguaglianze si provano in modo analogo.
Osservazione 85 a queste conclusioni si pu`o arrivare in modo pi`u elementare se si ricor-
dano le formule di Werner. il primo integrale si pu`o calcolare ricordando che
[cos nx][cos mx] = 1
2[cos(n+m)x+ cos(nm)x].
Pi`u in generale, su un intervallo [L, L] vale
ZL
L
ein(π/L)xdx=2Lse n= 0
0 se n6= 0
ZL
L
cos nx cos mx dx=
2Lse n=m= 0
0 se n6=m
Lse n=m
ZL
L
sin nx cos mx dx= 0 per ogni n,m.
ZL
L
sin nx sin mx dx=0 se n6=m
Lse n=m
(2.23)
Le uguaglianze precedenti mostrano che le funzioni
1
2L,1
Lcos nπ
Lx , 1
Lsin nπ
Lx ,
equivalentemente
1
2Lein(π/L)x,
sono due a due ortogonali in L2(L, L) e tutte di norma uguale ad 1. Si dice brevemente
che sono sistemi ortonormali in L2(L, L).
Quest’osservazione suggerisce che l’ambiente in cui `e pi`u facile studiare la serie di Fourier
sia lo spazio L2(L, L) e non lo spazio C(L, L).
2.6 La serie di Fourier in L2(L, L)
Non `e stato possibile introdurre in modo rigoroso lo spazio L2(L, L) e ci`o indica che lo
studio della serie di Fourier `e molto pi`u complesso di quello delle serie di potenze, e pu`o
essere solo accennato.
64 CAPITOLO 2. SUCCESSIONI E SERIE DI FUNZIONI
Consideriamo il polinomio trigonometrico
N
X
n=N
cnein(π/L)x, cn= ¯cn(2.24)
equivalentemente, se cn=an+ibn= ¯cn,
a0+
N
X
n=1
[ancos n(π/L)x+bnsin n(π/L)x].(2.25)
Indichiamo questo polinomio trigonometrico col simbolo P(x). Ovviamente, P(x) `e una
funzione continua e periodica su R. Se i valori di P(x) su [L, L] si conoscono, da questi
si ricavano facilmente i coefficienti cned i coefficienti anebn. Infatti, moltiplicando i due
membri dell’uguaglianza
P(x) =
N
X
n=N
cnein(π/L)x
per eir(π/L)xe integrando su [L, L] si trova 0 se r6=N. Altrimenti si trova
cr=1
2LZπ
π
P(x)eir(π/L)xdx .
Analogamente,
a0=1
2LRL
LP(x) dx
ak=1
LRL
LP(x) cos k(π/L)xdx(se k > 0)
bk=1
LRL
LP(x) sin k(π/L)xdx .
(ossia, la formula per a0non si ottiene da quella di akponendo k= 0. Per questa ragione
conviene scrivere a0separato dalla sommatoria).
Vale inoltre:
Teorema 86 E’:
1
2LZL
L|P(x)|2dx=
+N
X
n=N|cn|2
1
2LZL
L|P(x)|2dx=a2
0+1
2
+
X
n=1 a2
n+b2
n.
(2.26)
L’identit`a precedente va sotto il nome di Identit`a di Parseval .
Si noti il significato di a0e di c0: questi numeri sono le medie integrali di P(x).
Analogamente, il membro sinistro dell’identit`a di Parseval `e la media integrale di |P(x)|2.
Sia ora f(x) L[L, L]. Chiamiamo coefficienti di Fourier della funzione f(x) i
numeri
cr=1
2LZL
L
f(x)eir(π/L)xdx(2.27)
2.6. LA SERIE DI FOURIER IN L2(L, L) 65
(se vogliamo scrivere la serie di Fourier con gli esponenziali complessi),
a0=1
2LRL
Lf(x) dx
ak=1
LRL
Lf(x) cos k(π/L)xdx(se k > 0)
bk=1
LRL
Lf(x) sin k(π/L)xdx
(2.28)
(se vogliamo scrivere la serie di Fourier nel campo reale).
Si chiama serie di Fourier associata alla funzione f(x) la serie (2.13) con i coefficienti
dati da (2.28) o, equivalentemente, la serie (2.19) con i coefficienti dati da (2.27).
Per fissare le idee e scrivere formule pi`u semplici, usiamo ora la serie di Fourier scritta
mediante gli esponenziali complessi. Considerazioni del tutto analoghe valgono anche per
la serie di Fourier scritta nel campo reale.
Consideriamo la serie +
X
−∞
cneinx
e la sua somma parziale N–ma
SN(x) =
+N
X
N
cneinx .
Si noti che SN(x) `e il polinomio trigonometrico (2.24) e che, se cn=an+ibn= ¯cn, allora
SN(x) pu`o scriversi nella forma (2.25).
Si pu`o provare:
Teorema 87 Sia f L2(L, L). Vale:
lim
N+ZL
L|f(x)SN(x)|2dx= 0 ossia lim
N+||fSN||L2(L,L)= 0 .
Inoltre, la serie converge incondizionatamente, ossia la serie converge, e sempre alla mede-
sima funzione f(x), anche riordinandone i termini.
Dunque, la successione delle somme parziali (SN(x)) converge ad f(x) nella distanza di
L2(L, L). Sottolineiamo nuovamente che il teorema riguarda SN(x)e non per esempio una
somma Pn=N
n=Kcnein(π/L)x.Anche se i cnsono i coefficienti di Fourier di f, niente pu`o dirsi
del comportamento di questa serie per N+,K+in modo indipendente.
Diamo un’interpretazione geometrica di SN(x). Consideriamo il sottospazio lineare VN,
VN=(+N
X
n=N
γnein(π/L)x, γn= ¯γn, γnC)
Che `e uno spazio vettoriale di dimensione 2N+ 1. Si ha:
Teorema 88 La somma parziale SN(x)di f(x)`e l’elemento di VNche ha minor distanza
da f(x)nel senso della distanza di L2(L, L).
66 CAPITOLO 2. SUCCESSIONI E SERIE DI FUNZIONI
Dim.Facciamo la dimostrazione nel caso N= 1. La dimostrazione nel caso generale `e
analoga.
Gli elementi dello spazio V1sono le funzioni
γ0+γ1eix + ¯γ1eix γiC,
equivalentemente
α0+α1cos(π/L)x+β1sin(π/L)x , α0, α1, β1R.
Tra queste funzioni dobbiamo trovare quella che ha minima distanza da f(x). Si tratta
quindi di studiare un problema di minimo al variare dei parametri complessi γ0eγ1o,
equivalentemente, al variare dei parametri reali α0,α1,β1. Dato che i problemi di minimo
che si sono studiati sono quelli di funzioni di variabile reale, conviene studiare il minimo
della funzione
Φ(α0, α1, β1) = ZL
L
[f(x)α0α1cos(π/L)xβ1sin(π/L)x]2dx .
Il minimo esiste, come conseguenza del Teorema di Weierstrass, perch´e la funzione
(α0, α1, β1) Φ(α0, α1, β1)
`e continua e tende a +per ||(α0, α1, β1)|| +. Per trovarlo, annulliamo le derivate
prime9. Si trovano le condizioni
ZL
L
[f(x)α0α1cos(π/L)xβ1sin(π/L)x] dx= 0
ZL
L
[f(x)α0α1cos(π/L)xβ1sin(π/L)x] cos(π/L)xdx= 0
ZL
L
[f(x)α0α1cos(π/L)xβ1sin(π/L)x] sin(π/L)xdx= 0 .
Usando le uguaglianze (2.22), si trova che le tre derivate parziali si annullano solamente
quando
α0= (1/2L)ZL
L
f(x) dx
α1= (1/L)ZL
L
f(x) cos xdx
β1= (1/L)ZL
L
f(x) sin xdx;
ossia, il punto di V1che meno dista da f(x) `e S1(x).
9si pu`o provare che `e lecito derivare sotto il segno di integrale. Ci`o `e provato al para-
grafo 141. Alternativamente, si pu`o sviluppare il quadrato portare i coefficienti α0,α1eβ1
fuori dagli integrali. Quindi si calcolano le derivate.
2.6. LA SERIE DI FOURIER IN L2(L, L) 67
Dunque l’interpretazione della serie di Fourier in L2(L, L) `e la seguente: per ogni N
si considera il sottospazio VNdi dimensione finita 2N+ 1 di L2(L, L). Si scrive la serie di
Fourier di f(x) e si tronca all’indice N. Si trova un elemento di VNche `e proprio l’elemento
che meglio approssima la funzione f(x) nel senso di L2(L, L). Usando una terminologia
della geometria elementare, diremo che SN(x) `e la proiezione ortogonale di f(x) su VN.
Il Teorema 87 si pu`o riassumere dicendo che la successione delle proiezioni di fsui VNconverge
ad fin L2(L, L).
Diciamo infine che l’identit`a di Parseval vale per ogni f(x) L2(L, L):
1
2LZL
L|f(x)|2dx=
+
X
n=−∞ |cn|2
ossia
1
2LZL
L|f(x)|2dx=a2
0+1
2
+
X
n=1
[a2
n+b2
n].
Di conseguenza:
Teorema 89 La successione dei coefficienti di Fourier tende a zero.
L’identit`a di Parseval ha un’interpretazione importante per le applicazioni, che illustria-
mo con riferimento alla forma complessa, che scriviamo come:
ZL
L|f(x)|2dx= 2L"+
X
n=−∞ |cn|2#.
Interpretiamo la variabile xcome “posizione” ed f(x) come velocit`a”. Il primo integrale si
interpreta come energia” per esempio cinetica: la “somma” delle energie associate ad ogni
particella del corpo.
La “componente” di frequenza n/2L, ossia
cnein(π/L)x
ha quindi energia” 2L|cn|2. Quindi,
l’energia totale ottenuta sommando le energie in tutte le posizioni `e uguale alla
somma delle energie delle componenti di tutte le frequenze.
Naturalmente, niente vieta che nella rappresentazione di un segnale f(x) la componente
di frequenza n0/2Labbia “energia” nulla, ossia che cn0= 0. Le considerazioni precedenti
mostrano che l’energia di f(x) si ripartisce tra i segnali einx per cui cn6= 0.
La successione (n/2L, cn) si chiama lo spettro del segnale.
Infine, notiamo che l’identit`a di Parseval mostra che se i coefficienti di Fourier sono tutti
nulli allora la funzione `e nulla, ed ovviamente vale anche il viceversa. Ossia:
Teorema 90 Due funzioni f,gin L2(L, L)con i medesimi coefficienti di Fourier verifi-
cano
ZL
L|f(x)g(x)|2dx= 0 .(2.29)
Se accade che le due funzioni f(x) e g(x) sono continue, allora la condizione (2.29) implica che
esse coincidono. In generale, se vale (2.29), le due funzioni possono “considerarsi equivalenti”
nel senso che danno il medesimo contributo alle espressioni integrali nelle quali figurano.
68 CAPITOLO 2. SUCCESSIONI E SERIE DI FUNZIONI
Il calcolo dei coefficienti di Fourier
Il calcolo dei coefficienti di Fourier richiede il calcolo di integrali piuttosto noiosi. In certi
casi si possono usare dei trucchi che semplificano il calcolo. Per esempio:
Il prodotto di una funzione pari e di una dispari `e dispari; e una funzione dispari ha
integrale nullo su [L, L]. Dunque, se f(x)`e dispari, i coefficienti ansono tutti nulli.
Analogamente, se f(x)`e pari i coefficienti bnsono tutti nulli.
Si voglia calcolare la serie di Fourier della funzione f(x) = x. Questa `e una funzione
dispari e quindi vanno calcolati i soli coefficienti bn,
bn=1
LZL
L
xsin nπ
Lxdx .
Questi integrali si calcolano facilmente per parti ma ci`o richiede un calcolo indi-
pendente per ogni valore di n. Un modo pi`u veloce `e il seguente: si consideri la
funzione
s xsin sx ossia s d
dscos sx .
Il numero Lbn`e il valore per s=/L della funzione10
ZL
L
d
dscos sx dx=d
dsZL
L
cos sx dx=
d
ds2
ssin sL=2
s2sin sL 2L
scos sL
(formula valida per s6= 0). Calcolando per s=/L e dividendo per L, si trova
bn= 2(1)n+1 L
.
Dunque,
x= 2 L
π
+
X
n=1
(1)n+1
nsin nπ
Lx . (2.30)
Procedendo in modo analogo si verifichi che
x2=L2
34L2
π2"+
X
n=1
(1)n
n2cos nπ
Lx#.
Generalmente non `e lecito derivare termine a termine una serie di Fourier. Invece, se
f(x) L2(L, L), la serie di Fourier di f(x)pu`o integrarsi termine a termine: se
f(x) = a0+
+
X
n=1
[ancos n(π/L)x+bnsin n(π/L)x]
10Lo scambio del segno di derivata con quello di integrale `e giustificato al paragrafo 141.
2.6. LA SERIE DI FOURIER IN L2(L, L) 69
allora
F(x) = Zx
0
f(s) ds=a0x+L
π
+
X
n=1
bn
n
+L
π
+
X
n=1 an
nsin n(π/L)xbn
ncos n(π/L)x.
Si noti che quella ottenuta non `e una serie di Fourier, a causa del primo addendo a0x.Se
vogliamo la serie di Fourier di F(x) dobbiamo esprimere anche la funzione xmediante
la sua serie di Fourier, usando (2.30). In questo modo si trova
F(x) = L
π
+
X
n=1
bn
n
+L
π
+
X
n=1 2(1)n+1a0+an
nsin n(π/L)xbn
ncos n(π/L)x.
2.6.1 Estensioni pari e dispari, e serie di Fourier
Il fatto seguente si `e gi`a notato: la funzione f(x) sia pari,
f(x) = f(x).
In questo caso, ciascuna delle funzioni
f(x) sin nx
`e dispari e quindi ha integrale nullo: i coefficienti bnsono tutti nulli. Ovviamente, vale
anche il viceversa se i coefficienti bnsono tutti nulli, la somma della serie `e una funzione
pari. Analogamente, se f(x) `e dispari,
f(x) = f(x),
sono nulli i coefficienti ane viceversa. Dunque:
Teorema 91 Sia
f(x) = a0+
+
X
n=1 hancos nπ
Lx+bnsin nπ
Lxi.
La funzione f(x), periodica di periodo T= 2L, `e pari se e solo se bn= 0 per ogni n; `e
dispari se e solo an= 0 per ogni n.
Supponiamo ora che sia data una funzione f(x) definita solamente su [0, L]. Ad essa
possono associarsi infinite serie di Fourier, una per ciascuna “arbitraria estensione di f(x)
a [L, 0]. Tra queste estensioni due sono privilegiate: l’estensione pari e l’estensione dispari.
L’estensione pari conduce ad una serie di soli coseni mentre l’estensione dispari conduce ad
una serie di soli seni. Dunque:
70 CAPITOLO 2. SUCCESSIONI E SERIE DI FUNZIONI
Teorema 92 Sia f(x) L2(0, L). Essa `e somma di ununica serie di Fourier di soli seni,
e di ununica serie di Fourier di soli coseni. La prima definisce l’unica estensione dispari di
f(x)ad R, periodica di periodo 2L; la seconda definisce l’unica estensione pari di f(x)ad
R, periodica di periodo 2L.
Le formule per la serie di Fourier di f(x) di soli seni e di soli coseni si ottengono scrivendo
nelle (2.28) le opportune estensioni di f(x). Per esempio, usando l’estensione pari, per k6= 0
si trova
ak= (1/L)ZL
L
f(x) cos k(π/L)xdx=2
LZL
0
f(x) cos k(π/L)xdx .
Dato che queste formule (e la corrispondente identit`a di Parsevale) sono di uso molto comune,
vanno ricordate. E’ bene quindi scriverle in modo esplicito:
Sviluppo di Fourier in soli coseni
Sia f(x) L2(0, L). Si ha:
f(x) = α0+
+
X
n=1
αncos n(π/L)x
con
α0= (1/L)RL
0f(x) dx
αn= (2/L)RL
0f(x) cos n(π/L)xdx(se n > 0)
(2.31)
La corrispondente identit`a di Parseval `e
1
LZL
0|f(x)|2dx=α2
0+
+
X
n=1
α2
n=
+
X
n=0
α2
n.
Sviluppo di Fourier in soli seni
Sia f(x) L2(0, L). Si ha:
f(x) =
+
X
n=1
βnsin n(π/L)x
con
βn= (2/L)ZL
0
f(x) sin n(π/L)xdx . (2.32)
La corrispondente identit`a di Parseval `e:
1
LZL
0|f(x)|2dx=
+
X
n=1
β2
n.
2.6. LA SERIE DI FOURIER IN L2(L, L) 71
Osservazione 93 Sia f(x) = cos(π/L)x, definita su [0, L]. Vogliamo calcolarne lo sviluppo
di Fourier in soli coseni ed in soli seni. Lo sviluppo di Fourier in soli coseni `e
f(x) = cos(π/L)x .
Invece, per lo sviluppo di Fourier di soli seni dobbiamo calcolare i coefficienti bnusando la
formula (2.31). Ricordiamo la formula di Werner seguente:
(sin a)(cos b) = 1
2[sin(a+b) + sin(ab)] .
Si trova:
βn=2
LZL
0
cos(π/L)xsin n(π/L)xdx
=1
LZL
0nsin π
L(n+ 1)x+ sin π
L(n1)xodx
=1
π(n+ 1) {cos π(n+ 1) 1} 1
π(n1) {cos π(n1) 1}
=4
πn
n21se n`e pari
0 se n`e dispari.
Dunque,
cos π
Lx=8
π
+
X
k=1
k
4k21sin 2kπ
Lx , 0< x < L .
E’ questa la serie di Fourier dell’estensione per periodicit`a della funzione f(x) seguente, il
cui grafico (con L= 3) `e riportato in figura 2.9.
Figura 2.9: Estensione per periodicit`a della funzione (2.33)
−3 −2 −1 0 1 2 3
−1
−0.8
−0.6
−0.4
−0.2
0
0.2
0.4
0.6
0.8
1
f(x) = cos π
Lxse 0 < x < L
cos π
Lxse L < x < 0(2.33)
72 CAPITOLO 2. SUCCESSIONI E SERIE DI FUNZIONI
2.7 La convergenza puntuale della serie di Fou-
rier
E’ un fatto che la convergenza nel senso della norma di L2(L, L)non implica la convergenza
puntuale, nemmeno in un solo punto. Anzi, si prova che esistono funzioni continue e periodiche
su [L, L]la cui serie di Fourier non converge. Esistono per`o anche casi in cui la serie di Fourier
converge puntualmente. Come abbiamo detto questo accade se, per esempio, an=bn=qn
con |q|<1. Ci si pu`o chiedere se sia possibile dare condizioni sulla funzione f(x) che
implichino la convergenza puntuale della serie di Fourier. Condizioni per questo sono note.
In particolare si ha:
Teorema 94 Sia (a, b)[L, L]ed esistano Meα[0,1] tali che per ogni coppia x,y
di punti di (a, b)valga
|f(x)f(y)|< M|xy|α.(2.34)
Sia [a, b](a, b). La serie di Fourier di f(x)converge ad f(x) uniformemente in [a, b].
Una funzione f(x) ovunque derivabile con derivata limitata,
|f(x)|< M ,
in particolare verifica
|f(x)f(y)|< M|xy|
e quindi soddisfa alle condizioni del teorema. D’altra parte le ipotesi del teorema 94 impli-
cano la continuit`a della funzione f(x) e questa `e una condizione eccessivamente restrittiva
per molte applicazioni nelle quali interviene la serie di Fourier. Per cercare di indebolire
quest’ipotesi, studiamo cosa accade vicino ad un punto di salto di f(x).
Vale: Vale:
Teorema 95 La funzione f(x) L2(L, L)abbia un salto nel punto x0. Supponiamo
inoltre che esistano a < x0eb > x0tali che f(x)ammetta derivata prima continua sia su
(a, x0)che su (x0, b)e che esistano finiti i limiti
lim
xx0f(x),lim
xx0+f(x).
In questo caso la serie di Fourier di f(x)converge in ogni punto di (a, b)e inoltre:
Se [a, b](a, x0)oppure se [a, b](x0, b)allora la serie converge uniformemente
ad f(x)su [a, b].
in x0la serie di Fourier converge alla media dei valori dei limiti direzionali in x0:
1
2[f(x0) + f(x0+)] .
Esempio 96 Sia
χ(x) =
1 se π < x < 0
5 se x= 0
1 se 0 < x < π .
2.7. LA CONVERGENZA PUNTUALE DELLA SERIE DI FOURIER 73
Si noti che questa funzione differisce dalla funzione sgn (x) per il valore che assume in 0;
ma il valore assunto in un solo punto non altera gli integrali che definiscono i coefficienti
di Fourier. Dunque le funzioni definite su [π, π] ed uguali a χ(x) ed a sgn (x) hanno la
medesima serie di Fourier, che `e la serie
4
πsin x
1+sin 3x
3+sin 5x
5+···
Per x= 0 questa serie converge e converge al valore 0, media dei limiti direzionali di χ(x)
per x ±0. Per il teorema 95 la somma della serie `e quindi sgn (x).
La convergenza non pu`o essere uniforme perch´e le somme parziali sono continue mentre
la somma della serie non `e continua. Se si disegnano alcune somme parziali, come in figu-
ra 2.10, si vede che le somme parziali saltano sopra e sotto il valore ±1 di una quantit`a che
non si attenua al crescere di N. Calcoli piuttosto laboriosi mostrano che
lim
N+SN(1/N) = d
e si pu`o mostrare che d`e strettamente maggiore di 1:d > 1,089. E quindi al crescere di N
l’errore tra SN(x) e sgn (x) non si attenua (ma si concentra sempre di pi`u intorno al salto
x= 0).
Figura 2.10: Il fenomeno di Gibbs
-4 -3 -2 -1 0 1 2 3 4
-1.5
-1
-0.5
0
0.5
1
1.5
Il fenomeno appena illustrato non dipende dalla particolare funzione sgn (x) usata nel-
l’esempio. Si pu`o provare che, nelle ipotesi del Teorema 95, esso si verifica in vicinanza di
ogni salto. Tale fenomeno va sotto il nome di Fenomeno di Gibbs.
Infine, riportiamo alcune serie di Fourier di funzioni f(x) periodiche di periodo 2πe, nelle
figure seguenti, i grafici della restrizione della funzione a (π, π), con sovrapposti i grafici di
alcune somme parziali. Nella colonna di sinistra della tabella, si riporta l’espressione della
funzione su (π, π). La funzione `e poi estesa ad Rper periodicit`a.
74 CAPITOLO 2. SUCCESSIONI E SERIE DI FUNZIONI
sign x4
πsin x
1+sin3x
3+sin 5x
5+···
|x|π
24
πcos x
12+cos 3x
32+cos5x
52+···
x2sin x
1sin 2x
2+sin 3x
3 ···.
x+ 2πse π < x < 0
xse 0 < x < π π2sin x
1+sin 2x
2+sin 3x
3+···
|sin x|2
π4
πcos 2x
1·3+cos 4x
3·5+cos 6x
5·7+···.
sgn (x) cos x8
πsin 2x
1·3+2 sin 4x
3·5+3 sin 6x
5·7
2.7. LA CONVERGENZA PUNTUALE DELLA SERIE DI FOURIER 75
Figura 2.11: Le serie di Fourier delle restrizioni a (π, π) di f(x) = sign x
(sinistra sopra ), di f(x) = |x|(destra sopra), di f(x) = x(sinistra sotto) e di
f(x) = |sin x|(destra sotto)
−5 −4 −3 −2 −1 0 1 2 3 4 5
−1.5
−1
−0.5
0
0.5
1
1.5
x
π π
−5 −4 −3 −2 −1 0 1 2 3 4 5
0
0.5
1
1.5
2
2.5
3
3.5
x
π π
−5 −4 −3 −2 −1 0 1 2 3 4 5
−4
−3
−2
−1
0
1
2
3
4
x
π π
−5 −4 −3 −2 −1 0 1 2 3 4 5
−0.2
0
0.2
0.4
0.6
0.8
1
1.2
x
π π
76 CAPITOLO 2. SUCCESSIONI E SERIE DI FUNZIONI
Capitolo 3
Lo spazio lineare normato Rn
In questo capitolo richiamiamo e precisiamo alcuni concetti che dovrebbero essere noti dai
corsi precedenti, in particolare dal corso di Geometria. Tratteremo
lo spazio lineare Rn.
introdurremo “norme” e distanze” in Rn, che permetteranno di definire i punti di
accumulazione, gli insiemi aperti e gli insiemi chiusi. Ci`o fatto sar`a possibile studiare
limiti continuit`a e derivabilit`a.
introdurremo quindi il concetto di “insieme convesso” e di “insieme connesso”.
richiameremo le trasformazioni di coordinate in Rne la loro relazione con l’orienta-
zione dello spazio.
introdurremo altri modi (altri “sistemi di coordinate”) per rappresentare i punti di
R2e di R3.
studieremo le funzioni da Rin Rn.
I casi su cui insisteremo di pi`u saranno i casi n= 2 ed n= 3.
3.1 Lo spazio lineare Rn
Non intendiamo qui richiamare la definizione astratta di spazio lineare, vista nei corsi di
Geometria. Ci limitiamo a richiamare le sole nozioni necessarie per lo studio di Rn.
Gli elementi di Rnsono le n-ple ordinate di numeri reali che chiameremo indifferente-
mente punti” o “vettori”. E bene essere precisi con la notazione. Una di tali n-ple si potr`a
scrivere come una sequenza ordinata di nnumeri reali x1,x2,···,xnscritta in orizzontale o
in verticale, ossia come
x1x2x3··· xnoppure
x1
x2
x3
.
.
.
xn
.
77
78 CAPITOLO 3. LO SPAZIO LINEARE NORMATO RN
Noi useremo sempre la rappresentazione in verticale. Per`o, talvolta sar`a con-
veniente scrivere in orizzontale, con un apice (segno di trasposizione). Ossia intendiamo
x1x2x3··· xn=
x1
x2
x3
.
.
.
xn
.
Notiamo inoltre che la definizione di Rn`e suggerita dalla rappresentazione del piano in
coordinate cartesiane. Quando n= 2 oppure n= 3, per indicare il punto x1x2x3
useremo anche la notazione dellla geometria analitica, P(x1, x2, x3).
Gli elementi di Rn, ossia i “vettori”, si indicheranno con una lettera in grassetto:
x=
x1
x2
x3
.
.
.
xn
.
Ricordiamo che nei corsi di fisica i vettori si indicano con lettere in grassetto oppure con
una freccia sovrapposta,
x; talvolta con una lettera maiuscola, X, oppure con una lettera
sottolineata, x.
I numeri xisi chiamano le componenti del vettore x. Il vettore le cui componenti
sono tutte nulle si chiama vettore nullo e si indica col simbolo 0(da non confondere col
simbolo 0 usato per l’elemento nullo di R). In geometria analitica, il punto 0si chiama
anche origine delle coordinate e si indica col simbolo O, iniziale di “origine”.
Di regola, se xindica un vettore, le sue componenti si indicheranno come xi. Ricordiamo
che spesso i vettori si indicano col simbolo v, iniziale di “vettore”, ma anche col simbolo
r, iniziale di “raggio vettore”. Questo per quanto riguarda le notazioni con cui si indicano
gli elementi di Rn. Lo spazio Rnper`o non `e solo un isieme di elementi, ma `e anche uno
spazio vettoriale 1. Infatti gli elementi di Rnsi possono moltiplicare per numeri reali (che
si chiamano anche scalari ) e si possono sommare tra loro. Se α`e un numero reale, per
definizione si ha
α
x1
x2
x3
.
.
.
xn
=
αx1
αx2
αx3
.
.
.
αxn
.
1si ricordi che uno spazio vettoriale si chiama anche spazio lineare .
3.1. LO SPAZIO LINEARE RN79
La somma dei vettori xeysi ottiene sommando le componenti corrispondenti: x=
x1x2x3··· xn,y=y1y2y3··· yn, la loro somma `e
x+y=
x1
x2
x3
.
.
.
xn
+
y1
y2
y3
.
.
.
yn
=
x1+y1
x2+y2
x3+y3
.
.
.
xn+yn
.
Si rinvia ai corsi di Geometria per le propriet`a di queste operazioni. Ricordiamo per`o
che se n= 3 l’operazione di somma appena definita corrisponde alla somma di vettori con
la regola del parallelogramma nota dai corsi di Fisica.
Come terminologia, diremo anche che x+y`e ottenuto traslando di xil vettore yo, in
modo equivalente che `e ottenuto traslando di yil vettore x.
Si considerino ora rvettori v1, ..., vrdi Rn. Il vettore
r
X
i=1
αivi
(con αinumeri reali) si chiama combinazione lineare dei vettori vi.
L’insieme delle combinazioni lineari si chiama s.spazio lineare generato dai vettori v1,
..., vrdi Rn.Esso contiene sempre 0, che si ottiene scegliendo nulli tutti gli αi. Si
potrebbe trovare 0anche con altre scelte degli αi. Se ci`o non accade, i vettori visi chiamano
linearmente indipendenti . Ossia, i vettori visono linearmente indipendenti quando
r
X
i=1
αivi=0
implica αi= 0 per tutti gli indici i. In questo caso l’insieme dei vettori visi chiama una
base del s.spazio. Se r=ne se i vettori visono linearmente indipendenti, lo spazio da
essi generato `e Rne si dice che i vettori visono una base di Rn.
Osserviamo che ogni s.spazio lineare `e esso stesso uno spazio lineare rispetto alle operazioni
di somma e di prodotto per scalari.
Come base di Rnsi potranno scegliere nvettori indipendenti qualsiasi. Scegliendo
per`o i vettori ek,
ek=
0
0
.
.
.
1
.
.
.
0
con 1 nella posizione ke gli altri elementi tutti nulli, si ha la base canonica .
Esempio 97 Si sa dalla geometria analitica che i s.spazi di R2sono 0,R2e le rette per
l’origine. Se invece n= 3 i s.spazi sono 0,R3, le rette per l’origine ed i piani per l’origine.
80 CAPITOLO 3. LO SPAZIO LINEARE NORMATO RN
Siano ora Xed Ydue s.insiemi di Rn. Col simbolo X+Ysi intende l’insieme
X+Y={x+y,xX , yY}.
A noi interessa in particolare il caso in cui Y`e un s.spazio mentre Xha l’unico elemento
x0. L’insieme X+Yin questo caso si indica col simbolo
x0+Y
e si chiama s.spazio affine di Rn, parallelo ad Y, ottenuto traslando Ydi x0o anche in
x0. Si noti che:
Se x0/Yallora 0/x0+Y.
in generale, un s.spazio affine non `e un s.spazio lineare. Lo `e se e solo se si ha
x0+Y=Ye ci`o avviene se e solo se x0Y;
Come terminologia, in generale chiameremo semplicemente s.spazi” i s.spazi lineari
mentre l’aggettivo “affine” non verr`a mai omesso, salvo nei casi particolari seguenti, nei
quali useremo i termini “retta” e “piano” propri della geometria:
Gli spazi della forma {ty0}tR(con y06= 0) si chiamano rette per l’origine e
x0+ty0,tR, si chiama retta per x0parallela ad y0(che deve essere non nullo).
si chiama piano per l’origine in Rnl’insieme dei punti xle cui componenti x1,
. . . ,xnverificano l’equazione lineare
a1x1+a2x2+·+anxn= 0 .
I parametri a1, . . . ansono fissati, non tutti nulli.
Se X`e un piano per l’origine ed y=y1. . . ynun punto fissato di Rn,
l’insieme y+Xsi chiama piano per ye si vede facilmente che le componenti dei suoi
punti verificano
a1(x1y1) + a2(x2y2) + ·+an(xnyn) = 0 .
Vettori colineari e rette parallele
Due vettori non nulli vewsi dicono colineari quando le componenti corrispondenti sono
proporzionali, ossia quando esiste αR,α6= 0, tale che
v=αw.
Col linguaggio della geometria analitica, i due vettori vewsono colineari quando identificano
la medesima retta uscente dall’origine.
Consideriamo ora due rette,
{x0+tv, t R},{y0+τw, τ R}.(3.1)
Le due rette si dicono parallele quando i due vettori vewsono colineari. Geometri-
camente questo significa che un punto Qdella seconda retta si ottiene da un punto Pdella
prima retta, traslandolo mediante il vettore y0x0,indipendente dai punti PeQconsiderati.
3.1. LO SPAZIO LINEARE RN81
Due rette non parallele possono avere un punto comune, o meno. Nel secondo caso le
rette si dicono sghembe . Se le due rette hanno un punto comune, si dicono incidenti .
Ci`o accade quando esistono teτtali che
x0+tv=y0+τwossia x0y0=τwtv.
Dunque, le due rette (3.1) sono incidenti se e solo se x0y0appartiene al piano generato da
vew.
Osservazione 98 Sia m6= 0. Le due rette
x0+ty0,x0+tmy0, t R
coincidono.
3.1.1 Connessione e convessit`a
I punti di una retta hanno rappresentazione
x0+ty0, t R.(3.2)
Il punto x0si ritrova scegliendo t= 0. Per questo, come si `e detto, questa retta si
chiama “retta per x0, parallela ad y0”.
Sia ora x1un secondo punto di Rn. Chiediamoci se, per qualche selta di y, la retta (3.2)
contenga x1ossia, come si dice, “passi anche per x1”.
Ci`o avviene quando per un certo valore t1del “parametro” tsi ha
x0+t1y=x1.
Questo `e un insieme di nequazioni nelle ncomponenti di y. L’uguaglianza si ottiene solo
quando y`e dato da
y=1
t1
[x1x0].
Il valore t1pu`o scegliersi arbitrariamente, purce non nullo2. Dunque, scelto t1= 1, la retta
per x0ex1si rappresenta come
x=x0+t[x1x0].
Il suo s.insieme
{x0+t[x1x0], t [0,1]}
si chiama segmento congiungente x0ed x1. I punti x0ed x1si chiamano gli estremi
del segmento. Precisamente, x0, ottenuto per t= 0, si chiama il “primo estremo” ed x1,
ottenuto per t= 1, si chiama il secondo estremo”3.
Se x0=x1, il segmento degenera nel punto x0:
x0=x0+t[x1x0] = x0+t[x0x0]
2perch`e, come si `e gi`a notato, la retta per x0parallela ad y0non muta sostituendo y0
con my0, purch´e sia m6= 0.
3si osservi che la sostituzione t= 1 τ,τ(0,1), scambia il primo col secondo estremo.
82 CAPITOLO 3. LO SPAZIO LINEARE NORMATO RN
per ogni t.
Definiamo ora cosa si intende per spezzata” di Rn. Questo termine indica un numero
finito di segmenti che “si susseguono”; ossia tali che il secondo estremo di uno sia anche
primo estremo del successivo; ossia, consideriamo un numero finito di segmenti I1,I2, ...,
Ik. Se accade che per 1 < j < k il primo estremo di Ij+1 coincide col secondo estremo di
Ij, l’insieme k
j=1Ijsi dice una spezzata .
Si dice che una spezzata k
j=1Ijcongiunge i due punti xed yquando x`e il primo
estremo di I1ey`e il secondo estremo di Ik. Se accade che tali due punti coincidono, la
spezzata si dice chiusa .
Sia ora Aun s.insieme di Rn. L’insieme Asi dice connesso 4quando ogni coppia di
punti di Apu`o essere congiunta con una spezzata i cui punti appartengono ad A.
Inoltre, si considerano connessi anche gli insiemi costituiti da un solo punto.
Un insieme che `e sia aperto che connesso si chiama un dominio .
Pu`o accadere che l’insieme connesso Acontenga un punto x0con questa propriet`a: ogni
altro punto x1Apu`o essere congiunto ad x0mediante un segmento contenuto in A;ossia
mediante una spezzata costituita da un unico segmento. In tal caso l’insieme Asi dice
stellato rispetto ad x0.
Sia ora Cun s.insieme di Rn. Si dice che C`e convesso
quando `e vuoto oppure contiene un solo punto
oppure quando contiene il segmento congiungente due qualsiasi dei suoi punti.
Ossia, se a Cappartengono almeno due punti, allora C`e convesso quando `e stellato
rispetto a ciascuno dei suoi punti.
La figura 3.1 rappresenta un insieme connesso, a sinistra, ed un insieme convesso, a
destra.
Figura 3.1: Insieme connesso, a sinistra, e convesso a destra.
0 1 2 3 4 5 6
−1
−0.5
0
0.5
1
1.5
P Q
0 0.5 1 1.5 2 2.5 3 3.5
−2
−1.5
−1
−0.5
0
0.5
1
1.5
4pi`u precisamente si dovrebbe dire “connesso per archi”. La definizione che qui diamo
non ha la forma pi`u generale possibile. Per`o noi saremo principalmente interessati ad insiemi
connessi che sono anche “aperti” e per tali insiemi la definizione data coincide con quella
generale, che non riportiamo.
3.2. BASI E BASI ORDINATE 83
Per n= 1 le tre definizioni di insieme connesso per archi, stellato e convesso si riducono
a quella di intervallo.
3.1.2 Vettori liberi e vettori applicati
L’uso dei vettori `e suggerito dalle applicazioni fisiche: un “vettore” pu`o rappresentare, per
esempio, una forza o uno spostamento. Domanda ovvia: spostamento da dove, o forza
applicata dove? I vettori come n-ple ordinate di numeri reali non permettono di rispondere
a queste domande. Tali vettori possono usarsi per rappresentare uno “spostamento” nel
senso della distanza percorsa, in una certa direzione e in un certo verso, indipendentemente
da quale sia il punto di partenza; o una forza di una certa intensit`a diretta secondo una
certa direzione e con un certo verso, indipendentemente da dove essa sia applicata. Per
questa ragione, i vettori che abbiamo introdotto si chiamano in fisica vettori liberi . Si
pu`o decidere di applicare tutti i vettori liberi in un punto convenzionalmente scelto. La
scelta naturale `e di applicarli nell’origine: i vettori liberi verranno interpretati anche come
vettori applicati nell’origine e quindi, per esempio, il vettore 1 3 5 rappresenta lo
spostamento, in linea retta, da Oal punto P(1,3,5).
Se vogliamo rappresentare un vettore applicato dobbiamo dare una coppia di vettori:
il primo rappresenta il punto di applicazione e il secondo rappresenta il vettore (forza,
spostamento,. . . ) in esso applicato. A noi non serve essere troppo formali a questo proposito,
ma `e necessario sapere che:
sui vettori applicati nel medesimo punto si fanno tutte le operazioni (sia quelle gi`a
introdotte che quelle che introdurremo) che possono farsi tra vettori liberi. Dunque, se
1 2 3 e4 5 6 rappresentano due vettori applicati nel medesimo punto,
per esempio nel punto P(4,4,4), la loro somma `e il vettore 5 7 9 ancora
applicato in P(4,4,4).
Non si fanno operazioni tra vettori applicati in punti diversi.
Un vettore vapplicato in Ppu`o spostarsi per parallelismo in un vettore applicato in
Qprocedendo come segue: al vettore vapplicato in Psi fa corrispondere il vettore
vapplicato in Q.
Se si vogliono fare operazioni tra vettori applicati in punti diversi, bisogna prima di
tutto traslarli per parallelismo, applicandoli in un punto comune.
3.2 Basi e basi ordinate
Ricordiamo che una base di Rn`e un insieme di nvettori linearmente indipendenti. Un
insieme non cambia se si cambia l’ordine col quale se ne elencano gli elementi. Se per`o B
`e un insieme finito e si stabilisce un ordine tra i suoi elementi, si dice che B`e un insieme
ordinato e se B`e una base di Rn, si dice che B`e una base ordinata . Per esempio, se si
stabilisce di elencare gli elementi della base canonica elencando ejal jmo posto si ha una
base ordinata, ma si ha una base ordinata anche se si stabilisce di elencarne gli elementi a
rovescio, oppure prima quelli di indice pari e poi quelli di indice dispari.
Quando in Rnsi `e stabilita una base ordinata si possono fare cose che non sono possibili
con basi non ordinate. Per esempio, sia A`e una trasformazione lineare da Rnin Rme
84 CAPITOLO 3. LO SPAZIO LINEARE NORMATO RN
siano rispettivamente {ei}ed {˜ej}due basi ordinate la prima di Rne la seconda di Rm. La
trasformazione Asi pu`o rappresentare con una matrice come segue. Si considera l’elemento
Ae1Rm. Questo si rappresenta come
Ae1=
m
X
j=1
aj
1˜ej.
Si costruisce una matrice mettendo il numero aj
1nella posizione jdella prima colonna. La
seconda colonna si costruisce in modo analogo a partire da Ae2e cos`ı via fino a costruire
l’n-ma colonna.
Si costruisce cos`ı una matrice Ache rappresenta la trasformazione lineare A.
Se la base prescelta `e quella canonica e se non si stabilisce diversamente in modo esplicito,
si intende che la base canonica `e una base ordinata e che gli elementi della base si susseguono
nell’ordine dei loro indici:
e1,e2,... ,en.
Si dice che una base ordinata subordina un orientazione di Rn.Visto che una base di
Rncontiene nelementi, ci sono n! modi di elencarli e quindi si potrebbe pensare che in Rn
ci siano (almeno) n! orientazioni diverse. Invece non `e cos`ı. Consideriamo per questo una
base ordinata B1ed una seconda base ordinata B2, (che potrebbe essere ottenuta dagli stessi
elementi di B1, ordinati in modo diverso). Si sa dal corso di Geometria che i cambiamenti
di base si rappresentano mediante una matrice invertibile. Sia Pla matrice che trasforma
ordinatamente gli elementi di B1in quelli di B2. Essendo Pinvertibile, il suo determinante
non `e zero e quindi delle due l’una:
det P > 0 oppure det P < 0.
Se det P > 0 si dice che le due basi B1eB2subordinano la medesima orientazione di Rn,
altrimenti subordinano orientazioni opposte.
Dunque, in Rnsi trovano due orientazioni, che si dicono opposte l’una dell’altra.
3.2.1 Il piano e lo spazio
I punti del piano si mettono in corrispondenza biunivoca con quelli di R2procedendo come
segue: si fissano due rette incidenti (e tra loro diverse) red sdel piano ed un’unit`a di misura
per le lunghezze5. Il punto comune alle due rette si chiama origine . Su ciascuna delle due
rette si fissa un verso (che si chiama “positivo”). Il segmento P O della retta rha lunghezza
positiva quando un punto che parte da Oincontra Pmuovendosi nel verso positivo; negativo
altrimenti. In tal caso si dice che Pappartiene al semiasse positivo. La stessa convenzione
si usa sulla retta s.
Si fissa quindi un ordine tra le due rette. La prima si chiama asse delle ascisse
oasse xe la seconda asse delle ordinate oasse y.Le due rette si chiamano
assi coordinati . Le rette del piano parallele agli assi coordinati si chiamano rette coordinate .
5che assumeremo la medesima sullle due rette, ma si potrebbero anche fissare unit`a di
misura diverse, una sulla prima e una sulla seconda retta.
3.2. BASI E BASI ORDINATE 85
Facendo ci`o, si dice che si `e definita un’ orientazione del piano. Si fa quindi corrispon-
dere l’orientazione del piano con quella di R2associando il vettore e1al punto dell’asse delle
ascisse a distanza +1 dall’origine e il vettore e2col punto dell’asse delle ordinate a distanza
+1 dall’origine.
Sia Pun punto del piano. Si fanno passare per Pdue rette r1, parallela all’asse delle
ordinate, ed r2parallela a quella delle ascisse. Sia P1il punto in cui r1incontra l’asse delle
ascisse e P2l’intersezione di di r2con quello delle ordinate. Siano xed yle lunghezze, con
segno, rispettivamente di OP1e di OP2. Al punto Psi fa corrispondere il vettore
x=xe1+ye2.
Viceversa, ad ogni vettore xsi fa corrispondere un punto del piano.
Si noti che perch`e ci`o abbia senso, va stabilito prima quale asse scegliere come asse delle
ascisse, e quale dei due elementi della base considerare per primo. Ossia, la corrispondenza
biunivoca che abbiamo costruito `e tra il piano, a cui abbiamo imposto un’orientazione, ed
R2, a cui abbiamo imposto un’orientazione.
In pratica, si segue questa convenzione:
La base canonica di R2si ordina scegliendo prima e1;
sia fissato l’asse delle ascisse e il verso su di esso. Il semiasse “positivo” delle ascisse si
pu`o sovrapporre ad uno dei semiassi delle ordinate con due rotazioni una oraria ed una
antioraria. Dei due angoli, uno `e minore dell’altro. L’orientazione positiva sull’asse
delle ordinate si sceglie in modo che la sovrapposizione avvenga girando l’asse delle
ascisse in verso antiorario e dell’angolo minore.
La figura 3.2 illustra la situazione.
Figura 3.2: Senso positivo di rotazione e verso sugli assi coordinati
x
y
angolo minore
Il pi`u delle volte gli assi coordinati si prendono ortogonali tra loro e l’asse delle ascisse si
rappresenta orizzontale, col verso positivo verso destra. In tal caso il verso positivo dell’asse
delle ordinate punta verso l’alto.
86 CAPITOLO 3. LO SPAZIO LINEARE NORMATO RN
La rappresentazione dello spazio `e analoga. Senza entrare nei dettagli, consideriamo
subito il caso di un sistema cartesiano ortogonale. Si scelgono tre rette tra loro ortogonali
che si chiamano rispettivamente delle ascisse oasse x, delle ordinate oasse y, delle
quote oasse z.Gli assi xed yidentificano un piano, il piano (x, y), a cui l’asse z`e
ortogonale. L’orientazione sul piano (x, y) si fissa come si `e detto sopra. Rimane quindi da
scegliere il verso positivo dell’asse z. Questo si sceglie in modo che un osservatore in piedi
sul piano (x, y), appoggiato all’asse ze con la testa nel verso positivo veda che il semiasse x
positivo si riporta sul semiasse ypositivo ruotandolo dell’angolo minore e in verso antiorario.
Consideriamo ora il punto (1,0,0). Ruotando l’asse delle ascisse di un’angolo giro, esso
descrive una circonferenza e, se l’orientazione del piano (x, y) `e positiva, raggiunge il punto
(0,1,0) dopo una rotazione di un angolo retto in verso antiorario. Un insetto che parta da
(1,0,0) e si muova lungo la circonferenza verso il punto (0,1,0), raggiungendolo dopo la
rotazione di π/2, vede il disco alla sua sinistra.
E’ questa la prima comparsa della regola d’Amp`ere per la determinazione dell’orien-
tazione dello spazio.
Ogni punto Psi rappresenta mediante le sue tre coordinate x,yez. Queste si ot-
tengono facendo passare per Ptre piani, paralleli ai piani individuati dalle coppie di assi
coordinati (che si chiamano piani coordinati ). L’ascissa xdi P`e la distanza dall’origine
dell’intersezione tra l’asse delle ascisse e il piano per Pparalello agli assi yez, presa con
segno. L’ordinata e la quota si definiscono in modo analogo.
Si chiamano rette coordinate le rette dello spazio parallele agli assi cartesiani.
Sia ora Pun punto (del piano o dello spazio), P(x, y, x). Facciamogli corrispondere il
vettore v=xe1+ye2+ze3che si interpreta come “spostamento” percorso da un punto
che partendo dall’origine raggiunge la posizione occupata da P. In questo modo, lo spazio
si mette in corrispondenza biunivoca con R3, che si pensa orientato mediante la sua base
canonica.
Quando si lavora con un sistema di assi cartesiani ortogonali, si usano i simboli sequenti:
lavorando sul piano,
i=e1=1
0,j=e2=0
1.
Invece lavorando nello spazio
i=e1=
1
0
0
,j=e2=
0
1
0
,k=e3=
0
0
1
.
3.3 Norme e distanze
La teoria dei limiti per le funzioni di una variabile dipende in modo essenziale dalle propriet`a
seguenti del valore assoluto:
Per ogni xreale, |x| 0 e |x|= 0 se e solo se x= 0;
Il valore assoluto di un prodotto `e il prodotto dei valori assoluti: |xy|=|x|·|y|;
la disuguaglianza triangolare: |x+y| |x|+|y|.
3.3. NORME E DISTANZE 87
Ricordiamo che da queste propriet`a segue anche:
|x| |y| |xy|.
Esaminando il corso di Analisi Matematica 1, si vede facilmente che queste sono le uniche
propriet`a che servono per la teoria dei limiti, eccezion fatta per quei teoremi che richiedono
una relazione di ordine, come i teoremi del confronto o delle funzioni monotone.
L’osservazione precedente suggerisce di definire norma su Rnuna funzione definita su
Rned a valori reali, con le propriet`a che ora descriviamo. Una norma si indica col simbolo
k · k. Con questo simbolo, le propriet`a sono:
la norma prende valori non negativi: kxk 0 per ogni x;
la norma si annulla solo in 0:kxk= 0 implica x=0;
vale ktxk=|t|·kxkper ogni xe per ogni numero reale t. Si noti che scegliendo t= 0
si trova k0k= 0.
vale la disuguaglianza triangolare: per ogni coppia di vettori xeysi ha:
kx+yk kxk+kyk.
Non `e difficile provare:
Lemma 99 Per ogni x,yvale
kxk kyk kxyk.
Dim.Esattamente come nel caso dei numeri, si nota che la disuguaglianza da provare
equivale alle due disuguaglianze
−kxyk kxk kyk kxyk.
La seconda disuguaglianza segue dalla disuguaglianza triangolare, scrivendo
kxk=kxy+yk kxyk+kyk.
L’altra segue in modo analogo, scrivendo
kyk=kyx+xk kyxk+kxk=kxyk+kxk.
Dunque, definita una norma, `e possibile trattare la teoria dei limiti su Rnesattamente come
per n= 1, provando tutti i medesimi teoremi, con le stesse dimostrazioni, a parte quelli che
fanno intervenire la monotonia.
Mostriamo che norme su Rnesistono:
Esempio 100 Le seguenti sono norme su R2:
x y
1=|x|+|y|,
x y
= max{|x|,|y|}.
Si mostri per esercizio che le due funzioni definite sopra effettivamente soddisfano alle
propriet`a richieste per la definizione di norma.
88 CAPITOLO 3. LO SPAZIO LINEARE NORMATO RN
Quindi, su R2possono definirsi almeno due norme diverse. In realt`a si possono definire
infinite norme diverse. Infatti:
Teorema 101 Sia p1e sia Rnrappresentato rispetto alla base canonica. Ciascuna delle
seguenti `e una norma su Rn:
kxkp="n
X
i=1 |xi|p#1/p
.
Diciamo subito che la norma di gran lunga pi`u importante `e la norma che corrisponde
al numero p= 2, che si chiama norma euclidea :6
kxk2=p|x1|2+|x2|2+···+|xn|2.
Introdotta una norma si pu`o introdurre la distanza tra i vettori,
d(x,y) = kxyk
e quindi definire:
Definitione 1 Sia x0un punto di Rne sia r > 0. Si chiama intorno di x0di raggio r,
opalla aperta di centro x0e raggio rl’insieme
B(x0, r) = {v| kx0vk< r}.
Dato un insieme Adi Rned un vettore x0, si dice che:
Un insieme `e limitato quando esiste una palla che lo contiene.
x0`e interno ad Ase esiste r > 0tale che B(x0, r)A;
Si dice che x0`e punto di accumulazione per Ase per ogni r > 0esiste aA,
a6=x0, con aB(x0, r).
Il punto x0`e punto della frontiera di Ase non `e interno e ad Ae al suo
complementare.
Un insieme si dice aperto se tutti i suoi punti sono interni, oppure se `e vuoto; chiuso
se contiene tutti i suoi punti di accumulazione oppure se `e vuoto.
Si mostra facilmente che un insieme `e aperto se e solo se il suo complementare `e
chiuso.
Si chiama successione a valori in Rnuna funzione che ad ogni numero naturale
associa un vettore di Rn.
Una successione `e limitata quando limitata `e la sua immagine.
6si osservi che i valori assoluti nell’espressione seguente non hanno alcun ruolo. Sono
stati introdotti per due ragioni: prima di tutto per uniformit`a col caso p6= 2 e poi perch´e,
come diremo in seguito, niente cambia se i vettori si considerano a componenti complesse,
invece che reali; salvo che in tal caso anche la definizione di kxk2richiede i moduli perch´e
la norma deve comunque essere un numero reale.
3.3. NORME E DISTANZE 89
Sia {vn}una successione. Si dice che
lim
nvn=v0
quando, per ogni ǫ > 0esiste Nǫtale che se n > Nǫsi ha vnB(v0, ǫ).
Dato che le norme su Rnsono infinite, potrebbe sembrare che ci siano infinite teorie
dei limiti tra loro diverse. Invece, fortunatamente, le propriet`a di avere o non avere limite,
il valore dell’evenuale limite e le propriet`a dei limiti non dipendono dalla definizione di norma
che si decide di usare in Rn.Prima di provare questo fatto, illustriamone la ragione intuitiva
consideriamo le tre norme k · k1,k · k2ek · kin R2.
La figura 3.3 mostra le palle di centro 0 e raggio 1 relative alle tre norme. La palla
relativa alla norma euclidea `e un disco, in figura rappresentata come un ellisse perch´e l’unit`a
di misura sui due assi non `e la medesima. Le altre due palle sono quadrati (rettangoli in
figura, per la ragione detta sopra). Quello con i lati paralleli agli assi coordinati `e la palla
nella norma k · k.
Si vede da questa figura che se una successione vntende a zero rispetto ad una di queste
norme, entra e rimane definitivamente dentro ciascuna delle tre palle; e quindi tende a zero
anche rispetto alle altre norme.
Figura 3.3: Sfera di centro l’origine in norme diverse
−2 −1.5 −1 −0.5 0 0.5 1 1.5 2
−2
−1.5
−1
−0.5
0
0.5
1
1.5
2
Il risultato generale `e conseguenza delle disuguaglianze seguenti. La prima `e ovvia
mentre omettiamo la dimostrazione della seconda.
90 CAPITOLO 3. LO SPAZIO LINEARE NORMATO RN
Lemma 102 Sia k · kp,1p+una norma di Rn. Valgono le due disuguaglianze
seguenti:
Per ogni ivale |xi| kxk;
Esiste un numero M(che dipende da ne da p) tale che kxkpMPn
i1|xi|=kxk1.
In definitiva, per 1p+si ha
kxk1nkxkpMnkxk1.(3.3)
Accettando questo lemma possiamo provare:
Teorema 103 In Rn, una successione (vn)converge a v0in norma pse e solo se converge
al medesimo limite v0in qualsiasi altra norma q. Si ha kvnkp+se e solo se kvnkq
+.
Dim.Proviamo il primo asserto. Sostituendo vncon vnv0si pu`o studiare il caso della
convergenza a zero. Proviamo che kvnkp0 se e solo se kvnk10. Questo `e imme-
diato dal teorema del confronto per i limiti (di successioni a valori reali) applicato alla
disuguaglianza (3.3).
Il secondo asserto si prova in modo ovvio.
Inoltre, sia (vi
n) la successione di numeri reali ottenuta considerando la componente i-ma
dei vettori vn. Le disuguaglianze (3.3) mostrano:
Teorema 104 La successione (vn)converge se e solo se ciascuna delle successioni di
numeri reali (vi
n)`e convergente e il vettore lim vnha per i-ma componente il numero lim vi
n.
Osservazione 105 Si noti che un asserto analogo non vale per successioni divergenti
ossia tali che
lim kvnk= +.
Per questo basta che una delle successioni (vi
n) diverga!
3.3.1 Completezza di Rn
Si chiama successione fondamentale osuccessione di Cauchy una successione (vn) con
questa propriet`a:
Per ogni ǫ > 0esiste Nǫtale che se n > Nǫ,m > Nǫallora
kvnvmk< ǫ .
In simboli,
ǫ > 0Nǫ|n > Nǫ, m > Nǫ= kvnvmk< ǫ .
Una dimostrazione analoga a quella del Teorema 103 mostra che la propriet`a di esse-
re fondamentale non dipende dalla norma usata e per questo nella definizione precedente
abbiamo usato il generico simbolo di norma. Inoltre le disuguaglianze (3.3) mostrano che:
3.4. LA NORMA EUCLIDEA 91
Teorema 106 La successione (vn)`e fondamentale se e solo se ciascuna delle sue compo-
nenti `e una successione fondamentale di numeri reali.
Si sa dal corso di Analisi Matematica 1 che una successione di numeri converge se e solo se
`e fondamentale. E quindi quest’asserto vale anche in Rn:
Teorema 107 Una successione (vn)di Rnconverge se e solo se `e fondamentale.
Per dire che in Rnle successioni convergenti sono tutte e sole le successioni fondamentali
si dice che Rn`e completo .
Una successione (vn) si dice limitata la sua immagine `e limitata, ossia quando esiste
Mtale che
per ogni nvale kvnk< M .
Le disuguaglianze (3.3) mostrano che una successione `e limitata se e solo se sono limitate le
successioni delle sue componenti; e quindi anche in Rnvale il Teorema di Bolzano-Weierstrass
:
Teorema 108 (di Bolzano-Weierstrass) Ogni successione limitata ammette s.successioni
convergenti.
3.4 La norma euclidea
La norma di gran lunga pi`u utile `e la norma k · k2, perch´e essa ha una propriet`a ben
particolare, che ora illustriamo. Dai corsi di Geometria si sa che `e possibile definire il
prodotto scalare , detto anche prodotto interno , in Rne che quando si conoscono le
componenti di due vettori rispetto alla base canonica
x=
n
X
i=1
αiei,y=
n
X
i=1
βiei.
il prodotto scalare si calcola come7
x·y=
n
X
i=1
αiβi.
Si vede quindi che:
kxk2=x·x.(3.4)
Osservazione 109 Si osservi che il prodotto scalare di vettori associa a due vettori un
numero (e non un vettore)!
7talvolta invece che con vettori a componenti reali dovremo lavorare con vettori a com-
ponenti numeri complessi. In tal caso il prodotto scalare `e x·y=Pn
i=1 αi¯
βidove la barra
indica il coniugato. Si noti che in questo modo x·x`e sempre reale e positivo e la (3.4) vale
anche per vettori a componenti numeri complessi.
92 CAPITOLO 3. LO SPAZIO LINEARE NORMATO RN
Diciamo infine che un vettore che ha norma euclidea uguale ad 1 si chiama versore . I
particolari versori i,j,kdi R3(o di R2se non si considera k) si chiamano i versori degli
assi coordinati.
Chiamiamo ora ortogonali due vettori che hanno prodotto scalare nullo e mostriamo
che vale:
Teorema 110 (Teorema di Pitagora ) Se xeysono due vettori di Rn, si ha
kx+yk2
2=kxk2
2+kyk2
2.
Dim. Si ricordi dai corsi di geometria che il prodotto scalare gode della propriet`a distributiva:
x·(y+z) = x·y+x·z= (y+z)·x.
Dunque,
kx+yk2
2= (x+y)·(x+y)
=x·x+ (x·y+y·x) + y·y=kxk2
2+|yk2
2
perch´e ambedue gli addendi in parentesi sono nulli.
Quando xeysono ortogonali, il vettore x+y`e l’ipotenusa del triangolo rettangolo di
cateti xey, si veda la figura 3.4. Dunque Il Teorema di Pitagora si interpetra dicendo che
in R2il quadrato costruito sull’ipotenusa di un triangolo rettangolo ha per area la somma
delle aree dei quadrati costruiti sui cateti.
Figura 3.4: Teorema di Pitagora e identit`a del parallelogramma
−3 −2 −1 0 1 2 3
−3
−2
−1
0
1
2
3
x
y
x
y
−3 −2 −1 0 1 2 3
−3
−2
−1
0
1
2
3
x
y
y
x
Mostriamo ora una particolarissima propriet`a della norma euclidea, che si chiama iden-
tit`a del parallelogramma .
3.4. LA NORMA EUCLIDEA 93
Teorema 111 Siano xeydue vettori di Rn. Vale
kx+yk2+kxyk2= 2 kxk2+kyk2.
Dim.Usando la propriet`a distributiva del prodotto scalare, calcoliamo
kx+yk2+|xyk2= (x+y)·(x+y) + (xy)·(xy)
= (x·x+x·y+y·x+y·y)
+(x·xx·yy·x+y·y) = 2x·x+ 2y·y= 2 kxk2+kyk2.
La norma euclidea `e l’unica norma che gode di questa propriet`a. Per esercizio, si mostri
che la propriet`a del parallelogramma non vale per i vettori 0 1 e1 0 di R2con
k · k.
La figura 3.4 a destra mostra il significato dell’identit`a del parallelogramma in R2:
x+yexysono le diagonali del parallelogramma identificato dai due vettori xey
e quindi l’identit`a del parallelogramma `e un’estensione del teorema di Pitagora: in un
parallelogramma, la somma delle aree dei quadrati costruiti sulle due diagonali `e uguale alla
somma delle aree dei quadrati costruiti sui quattro lati.
Il prodotto scalare si definisce tra vettori liberi; la definizione si estende quindi al caso
dei vettori applicati nel medesimo punto come si `e detto al paragrafo 3.1.2.
Da ora in poi, se non si specifica esplicitamente il contrario, la norma in Rnsar`a
la norma k · k2, che indicheremo k · k, sottintendendo l’indice. Useremo norme
diverse per fare delle dimostrazioni se questo sar`a conveniente. Infatti, il fatto che
la relazione di convergenza non dipenda dalla particolare norma usata per verificarla
pu`o usarsi per semplificare alcune dimostrazioni.
3.4.1 R2e R3con la norma euclidea
Vogliamo ora esaminare pi`u in dettaglio il caso di R2e di R3con norma euclidea. Diamo
per`o la definizione seguente che vale anche in Rn, dotato della norma euclidea e quindi del
prodotto interno: due vettori xeysi dicono ortogonali quando hanno prodotto scalare
nullo:
xyquando x·y= 0.
Si fissi ora il vettore v=ai+bj6=0. Sono ad esso ortogonali i vettori w1=biaje
w2=bi+aj. Le matrici che trasformano la base canonica rispettivamente nella base
{v,w1}e{v,w2}sono rispettivamente
a b
ba,a b
b a .
La prima ha determinante negativo mentre la seconda ha determinante positivo. Dunque, la
base {v,w2}`e orientata positivamente, ossia, come anche si dice, ha orientazione concorde
con quella dello spazio. Per questa ragione, se non si specifica esplicitamente il contrario,
come vettore ortogonale a vsceglieremo bi+aj.
Vediamo ora di chiarire il significato geometrico dei determinanti di matrici 2×2 e 3×3.
Siano vewdue vettori, di componenti rispettivamente (a, b) e (c, d) rispetto alla base
canonica di R2. Questi vettori identificano i due punti del piano P(a, b) e Q(c, d).
Vogliamo calcolare l’area del parallelogramma in figura 3.5.
94 CAPITOLO 3. LO SPAZIO LINEARE NORMATO RN
Figura 3.5: Calcolo dell’rea di un parallelogramma
0 0.5 1 1.5 2 2.5 3 3.5 4
0
0.5
1
1.5
2
2.5
3
3.5
4
w
v
h
Si sa che l’area `e il prodotto della lunghezza di un lato per l’altezza ad esso relativa.
Scegliendo come lato quello identificato dal vettore v=ai+bj, vogliamo calcolare
kvkkhk
ove h`e il vettore, applicato in Q, indicato in figura 3.5.
Dividendo per kvknon `e restrittivo supporre kvk= 1, ossia a2+b2= 1. In questo caso
l’area `e khk. L’altezza `e il vettore
h=w(w·v)v.
Ricordando che a2+b2= 1, si calcola:
khk2= [w(w·v)v]·[w(w·v)v]
= [c(ca +bd)a]2+ [d(ca +bd)b]2
=c22ac(ca +bd) + d22bd(ca +bd) + (a2+b2)(ca +bd)2
=c2(1 a2) + d2(1 b2)2cabd = (cb)2+ (da)22cabd
= (cb ad)2
e quindi l’area `e
|cb ad|=
det a c
b d
.
Si trova quindi un’interpretazione geometrica per il valore assoluto del determinante di una
matrice 2 ×2: il numero det v w `e l’area del parallelogramma identificato dai due
3.5. IL PRODOTTO VETTORIALE 95
vettori vew(applicati nell’origine). Il determinante stesso si interpretra anche come “area
con segno” del parallelogramma identificato dai vettori che sono le colonne della matrice.
Si pu`o quindi concludere che valgono le affermazioni seguenti, per ogni coppia di vettori v,
wdi R2(in quest’ordine) e per la matrice
A=v w :
Condizione necessaria e sufficiente perch´e i due vettori siano colineari `e che il deter-
minante di Asia nullo;
se il determinante `e non nullo, i due vettori vew(in quest’ordine) sono una base
ordinata di R2; il parallelogramma che essi identificano ha “area con segno” che `e
positiva se e solo se essi, presi nell’ordine dato, sono una base orientata positivamente;
la matrice Asubordina una trasformazione lineare in R2. Siano rerdue vettori
(applicati nell’origine) e ˜
r=Ar,˜
r=Arle loro immagini mediante la matrice
A. Sia Ril parallelogramma identificato dai vettori rere sia ˜
Ril parallelogramma
identificato dalle loro immagini. L’area del parallelogramma ˜
R`e il prodotto di |det A|
per l’area del parallelogramma R:
(area di ˜
R) = |det A| · (area di R). (3.5)
Risultati del tutto analoghi valgono anche in R3. Dati tre vettori u,vew, in quest’or-
dine, si costruisce la matrice
A=u v w .
Il valore assoluto del suo determinante `e il volume del parallelepipedo identificato dai tre
vettori (applicati nell’origine). La matrice Aidentifica una trasformazione lineare. Tale
trasformazione applicata ai punti di un parallelepipedo lo trasforma in un altro, il cui volume
differisce da quello del primo per il fattore |det A|.
Il numero det Asi interpreta come volume con segno”.
3.5 Il prodotto vettoriale
A differenza delle operazioni tra vettori introdotte fino ad ora, che valgono in Rnper ogni
n, l’operazione di prodotto vettoriale `e specifica di R3. Essa si definisce ponendo:
ii= 0 ,jj= 0 ,kk= 0 ,
ij=k,jk=i,ki=j,
ij=ji,jk=kj,ki=ik.
Completiamo ora la definizione di prodotto vettoriale ponendo
vw= (ai+bj+ck)(xi+yj+zk) = (bz cy)i+ (cx az)j+ (ay bx)k
formalmente ottenuta distribuendo le somme sui prodotti e facendo uso delle regole per i
prodotti vettoriali degli elementi della base. Di conseguenza, si verificano le regole seguenti:
1. vw=wv;
2. vw`e ortogonale sia a vche a w;
96 CAPITOLO 3. LO SPAZIO LINEARE NORMATO RN
3. vale:
(rv)·w= det r v w .
Quindi, il valore assoluto |(rv)·w|`e il volume del parallelepipedo identificato dai
tre vettori (pensati applicati nell’origine);
4. In particolare,
det r v r v= (rv)·(rv).
Questo numero `e zero se i vettori revsono colineari. Altrimenti `e positivo. Dunque,
i tre vettori r,v,rv(presi in quest’ordine e con revnon colineari) subordinano
in R3l’orientazione positiva.
Si noti che:
Il prodotto vettoriale si definisce per vettori liberi; la definizione si estende quindi al
caso dei vettori applicati nel medesimo punto come si `e detto al paragrafo 3.1.2.
Il prodotto vettoriale di due vettori `e un vettore. Per contrasto, il prodotto scalare di
due vettori `e un numero.
Il prodotto vettoriale `e nullo se e solo se i due vettori sono colineari. Per contrasto,
il prodotto scalare `e nullo se e solo se i due vettori sono ortogonali.
Infine, si noti che le regole per il calcolo del prodotto vettoriale sono definite in modo da
“mimare” quelle per il calcolo dei determinanti.
Osservazione 112 Il prodotto vettoriale pu`o definirsi in particolare per vettori complanari,
per esempio per vettori del piano z= 0. In tal caso il prodotto vettoriale `e un vettore
“verticale”, ossia parallelo all’asse z.
Osservazione sulla notazione La notazione col punto, v·w, per indicare il
prodotto scalare `e oggi universalmente usata8. Invece, la notazione per il prodotto vettoriale
non `e cos`ı uniforme. La notazione vwsi trova principalmente in testi europei, mentre in
testi americani (ed anche inglesi) il prodotto vettoriale `e indicato v×w.
3.6 Coordinate curvilinee nel piano e nello spa-
zio
Il modo pi`u comune per rappresentare i punti del piano, o dello spazio, usa le coordinate
cartesiane ortogonali. Per`o, punti del piano e dello spazio possono rappresentarsi, oltre che
in coordinate cartesiane ortogonali mediante coordinate cartesiane oblique o anche con
altri “sistemi di coordinate” che generalmente costruiscono corrispondenze biunivoche tra i
punti (del piano o dello spazio) (o talvolta di opportuni loro s.insiemi) ed opportuni s.insiemi
di R2oppure di R3. Per ragioni che vedremo, si parla in tal caso di coordinate curvilinee .
Noi esamineremo prima le coordinate cartesiane oblique (nel piano. La semplice estensione
8in libri molto vecchi e assai raramente in testi recenti si trova usata la croce per il
prodotto scalare, v×w.
3.6. COORDINATE CURVILINEE NEL PIANO E NELLO SPAZIO 97
Figura 3.6: Coordinate oblique
x
O
y
P
P1
P2
P
x
y
z
P0
P1
P2
P3
allo spazio `e lasciata al lettore). Poi studieremo alcuni casi particolari di coordinate curvi-
linee: vedremo l’uso delle coordinate polari e delle coordinate ellittiche per rappresentare
i punti del piano cartesiano e l’uso delle coordinate cilindriche , sferiche ed ellittiche
per rappresentare i punti dello spazio, che supporremo dotato di un sistema di coordinate
cartesiane ortogonali.
Coordinate cartesiane oblique nel piano (e nello spazio). Fissata
l’origine O, tracciamo per essa due rette non coincidenti (tre rette non complanari nello
spazio). Queste rette si chiamano assi cartesiani obliqui .
Si decida quale `e la prima retta, asse delle ascisse, la seconda, asse delle ordinate, un
verso positivo su di esse e un’unit`a di misura (che potrebbe anche essere diversa. Noi
assumeremo che sia la medesima). Da un punto Pfacciamo uscire due rette, parallele agli
assi delle ordinate e delle ascisse. La retta parallela all’asse delle ordinate interseca l’asse
delle ascisse in un punto P1la cui distanza distanza (con segno) da Osi chiama l’ ascissa
di P. In modo analogo si definisce l’ ordinata di P. La coppia ordinata dell’ascissa e
dell’ordinata rappresenta univocamente il punto P. Si veda la figura 3.6.
Un problema importante `e di passare da un sistema di coordinate ad un altro. Limitia-
moci a studiare il caso di due sistemi di coordinate, uno un sistema di coordinate cartesiane
ortogonali del piano ed uno un sistema di coordinate oblique. Provvisoriamente indichiamo
con lettere greche le coordinate oblique: ξ`e l’asse delle ascisse (oblique) ed ηquello delle
ordinate.
Indichiamo con ieji versori degli assi cartesiani ortogonali e siano
v1=icos θ+jsin θ , v2=icos φ+jsin φ
i versori degli assi obliqui, si veda la figura 3.7.
Si conoscano le coordinate cartesiane ortogonali (x, y) del punto P. Le coordinate
oblique di Psono le distanze dall’origine dei vettori dei punti P1eP2, che avranno forma
ξv1, ηv2
98 CAPITOLO 3. LO SPAZIO LINEARE NORMATO RN
Figura 3.7: Trasformazione a coordinate oblique
P
θ
φ
P1
P2
x
y η
ξ
per certe scelte dei parametri ξeη. Poice v1ev2sono versori, le coordinate oblique di P
sono proprio i numeri ξeη, che ora vogliamo calcolare. Ci`o si fa notando che
xi+yj=ξv1+ηv2=ξ(icos θ+jsin θ) + η(icos φ+jsin φ).
Uguagliando le componenti si ottiene immediatamente
(ξ=ycos φxsin φ
sin(θφ),
η=xsin θycos θ
sin(θφ),x=ξcos θ+ηcos φ
y=ξsin θ+ηsin φ .
Si noti che il denominatore `e non nullo perch`e gli assi obliqui non coincidono.
Si osservi un caso particolare: supponiamo che φθ=π/2. In questo caso gli “assi
obliqui” sono tra loro perpendicolari e si vuol rappresentare il medesimo punto Prispetto
a due sistemi di assi cartesiani ortogonali ruotati l’uno rispetto all’altro. Precisamente, il
secondo sistema `e ottenuto ruotando il primo dell’angolo θ(in senso positivo o negativo).
Essendo in questo caso particolare φ=θ+π/2, le coordinate (ξ, η) sono date da
ξ=xcos θ+ysin θ
η=xsin θ+ycos θ , x=ξcos θηsin θ
y=ξsin θ+ηcos θ .
Coordinate polari nel piano. Sia Pil punto da rappresentare. Si rappresenta
Pmediante la sua distanza da Oe mediante l’angolo θtra la retta rche esce dall’origine O
e punta verso Pe il semiasse positivo delle ascisse. L’angolo si sceglie col segno in questo
modo: si orienta la retta rda Overso P; si riporta il semiasse x > 0 sulla semiretta r,
ruotando dell’angolo minore. L’angolo θcos`ı ottenuto si intende positivo se la rotazione `e
antioraria (si confronti con la regola d’Amp`ere).
In questo modo si stabilisce una corrispondenza biunivoca tra i punti del piano (x, y),
escluso O, e le coppie di numeri (ρ, θ) con ρ > 0 e 0 θ < 2π.
3.6. COORDINATE CURVILINEE NEL PIANO E NELLO SPAZIO 99
Figura 3.8: coordinate polari
0 0.5 1 1.5 2 2.5 3
−1
−0.8
−0.6
−0.4
−0.2
0
0.2
0.4
0.6
0.8
1
x
r
θ
Dunque, ogni punto Pdel piano (x, y), escluso O, viene identificato dalla coppia dei
numeri ρeθ, che si chiamano le coordinate polari di P.
L’origine invece `e identificata da (0, θ) per ogni θ. Si veda la figura 3.8. Il numero ρsi
chiama il definmodulo e θsi chiama l’ argomento }o anomalia }oanomalia di P.
La relazione tra le coordinate cartesiane e le coordinate polari `e data da:
x=ρcos θ , y =ρsin θ .
nel contesto delle coordinate polari, il semiasse positivo delle ascisse si chiama anche
asse polare e il suo estremo, ossia l’origine, si chiama anche polo .
Osservazione 113 Va notato che la corrispondenza (ρ, θ)7→ (x, y)`e suriettiva ma non
iniettiva; dunque non invertibile. Si trova una corrispondenza biunivoca di R2\ {0}se
(ρ, θ)(0,+)×[0,2π).
Coordinate polari ellittiche piano. Siano assegnati due numeri positivi a
eb. Le coordinate polari ellittiche nel piano si ottengono rappresentando i punti (x, y)
mediante i numeri (ρ, θ) tali che
x=ρa cos θ , y =ρb sin θ .
Le curve coordinate delle coordinate polari od ellittiche. Torniamo
alle relazioni
x=ρa cos θ , y =ρb sin θ .
100 CAPITOLO 3. LO SPAZIO LINEARE NORMATO RN
Figura 3.9: coordinate cilindriche
−1
−0.5
0
0.5
1
−1
−0.5
0
0.5
1
−1
−0.5
0
0.5
1
p
x
y
z
z
r
θ
Queste relazioni identificano un punto (x, y) del piano per ogni scelta di (ρ, θ). Si chiamano
curve coordinate quelle ottenute da queste espressioni per θfissato al variare di r(rette
per l’origine) e per rfissato al variare di θ(ellissi; nel caso particolare delle coordinate polari
si hanno circonferenze).
Coordinate cilindriche nello spazio. Sia P(x, y, z) un punto dello spa-
zio, riferito ad un sistema di coordinate cartesiane ortogonali. Il punto Q(x, y, 0) si
chiama la proiezione ortogonale di Psul piano z= 0. Il punto Qsi pu`o rappresentare
mediante le sue coordinate polari (ρ, θ) e quindi Pviene ad essere rappresentato mediante
(ρ, θ, z). Quando si fa uso di questa rappresentazione si dice che si rappresenta lo spazio in
coordinate cilindriche , si veda la figura 3.9.
Se invece delle coordinate polari, sul piano si usano le coordinate ellittiche, le corrispon-
denti coordinate nello spazio si chiamano cilindriche ellittiche .
Le superfici coordinate delle coordinate cilindriche. Le curve coor-
dinate sono quelle curve che si ottengono tenendo fissi i valori di due parametri e facendo
variare il terzo. Sono quindi rette per l’origine, circonferenze (o ellissi) e rette verticali.
Per`o nello spazio si possono anche definire le superfici coordinate , ottenute tenendo fisso
un parametro e facendo variare gli altri due. Quindi, nel caso delle coordinate cilindriche
ellittiche, le superfici coordinate sono cilindri ellittici di asse parallelo all’asse z(ottenuti
tenendo fisso il valore di ρ); piani per l’asse z(ottenuti tenendo fisso il valore di θ); piani
perpendicolari all’asse z(ottenuti tenendo fisso il valore di z).
3.6. COORDINATE CURVILINEE NEL PIANO E NELLO SPAZIO 101
Figura 3.10: coordinate sferiche
−2
−1
0
1
2
3
4
−2
−1
0
1
2
3
4
−2
−1
0
1
2
3
4
x
z
θ
r
φ
Coordinate sferiche ed ellittiche nello spazio. Le coordinate sferiche
nello spazio sono l’analogo delle coordinate polari nel piano. Per rappresentare un punto
P(x, y, z), si costruisce la retta congiungente Ocon P. Si rappresenta Pmediante (r, θ, φ)
dove r`e la distanza di Pda Oe ancora si chiama l’ argomento di P;θ`e l’argomento della
proiezione Qdi Psul piano z= 0, φ`e l’angolo tra il versore νche sulla retta da OaP
punta verso Ped il versore k. L’ampiezza di quest’angolo si intende compresa tra 0 e π.
Dunque, si veda la figura 3.10, Psi rappresenta anche con la terna (r, θ, φ) con
r0,0θ < 2π , 0φπ .
Questi numeri si chiamano le coordinate sferiche di P. La relazione tra le coordinate
cartesiane e le coordinate sferiche `e la seguente:
x=rcos θsin φ , y =rsin θsin φ , z =rcos φ .
Il numero rsi chiama ancora modulo , il numero θsi chiama longitudine mentre il
numero φsi chiama colatitudine .
Siano dati ora tre numeri positivi a,bec. Le coordinate ellittiche di un punto nello
spazio sono le coordinate (ρ, θ, φ) che si ottengono imponendo
x=ra cos θsin φ , y =rb sin θsin φ , z =rc cos φ .
Le superfici coordinate delle coordinate sferiche ed ellittiche. Nel
caso delle coordinate sferiche, le superfici coordinate sono sfere di centro l’origine (ottenute
102 CAPITOLO 3. LO SPAZIO LINEARE NORMATO RN
tenendo fisso il valore di r); piani per l’asse z(ottenuti fissando il valore di θ; (semi)coni
circolari di asse sull’asse z(ottenuti tenendo fisso il valore di φ).
Per esercizio, se ne identifichino le curve coordinate e si identifichino anche le curve e le
superfici coordinate delle coordinate ellittiche.
3.7 Funzioni da R in Rn
Studiamo ora le propriet`a di limite e continuit`a delle funzioni definite su sottoinsiemi di R
ed a valori in Rn.
Sia xRnun vettore e siano xile sue componenti. E utile tener presente le
disuguaglianze seguenti (si vedano le (3.3)):
Per ogni ivale |xi| kxk;
Esiste un numero M=Mn,p tale che kxkpMPn
i=1 |xi|.
Le funzioni da Rin Rsono state studiate nel corso di Analisi Matematica 1. E’ facile
adattare gli argomenti visti nel corso di Analisi Matematica 1 al caso di funzioni a valori
vettoriali. Per l’uso che a noi servir`a, consideriamo funzioni definite su un intervallo I,
aperto o meno, limitato o meno, a valori in Rn. Dunque, si specifica la funzione assegnando
ad ogni valore tIun vettore x(t)Rn, ossia assegnando le sue ncomponenti. Si
costruisce cos`ı una funzione
tx(t) =
x1(t)
x2(t)
.
.
.
xn(t)
=x1(t)e1+x2(t)e2+···+xn(t)en.
Nel caso di R2o di R3scriveremo anche
x(t) = x(t)i+y(t)j+z(t)k.
Notiamo che le componenti di x(t) sono funzioni da Rin Re quindi le nozioni apprese
nel corso di Analisi 1 possono essere applicate a ciascuna componente. Ora definiamo:
Limiti e continuit`a
Si fissi un punto t0. Il punto t0pu`o essere un punto di Io anche un estremo di Iche non
gli appartiene.
Si dice che limtt0x(t) = lquando assegnata una qualsiasi palla B(l, ǫ) centrata
in lesiste un intorno Iǫ(t0) tale che se tIǫI,t6=t0, allora x(t)B(l, ǫ). In
simboli,
ǫδ|tIe 0 <|tt0|< δ kx(t)lk< ǫ .
Se tIe inoltre
lim
tt0
x(t) = x(t0)
si dice che la funzione `e continua in t0.
3.7. FUNZIONI DA RIN RN103
Si lascia per esercizio di definire i limiti per t+e per t −∞, sulla falsariga della
definizione del limite di successioni, vista al paragrafo 3.3. Si noti per`o che non `e possibile
definire limiti uguali a ±∞. Se x(t) non rimane limitata allora possiamo definire solamente
lim kx(t)k= +e si ricade in un caso gi`a trattato nel corso di Analisi Matematica 1 perch´e
la funzione t kx(t)k`e una funzione da Rin e.
Siano xi(t) le componenti di x(t) ed liquelle di l. Il teorema seguente `e analogo al
Teorema ??.
Teorema 114 Vale lim x(t) = lse e solo se per ogni ivale lim xi(t) = li.
Una funzione tx(t)da Rin Rn`e continua se e solo se ciascuna sua componente `e
una funzione continua da Rin R.
Noto ci`o, `e immediato dedurre il risultato seguente:
Teorema 115 Siano tx(t)ety(t)due funzioni da Rin Rndefinite sul medesimo
intervallo Ied ambedue continue e sia tk(t)una funzione da Rin Rdefinita su Ie
continua. Le funzioni
tk(t)x(t), t x(t) + y(t), t x(t)·y(t)
(il punto indica il prodotto scalare calcolato per ogni valore di t) sono continue.
Se n= 3, anche la funzione tx(t)y(t)`e continua.
Si lascia per esercizio di enunciare i teoremi corrispondenti per i limiti.
i simboli di Landau
Si dice che x(t) `e un infinitesimo per tt0quando
lim
tt0
x(t) = 0 .
Siano x(t) e y(t) due funzioni definite sul medesimo intervallo Ie se ne vogliano studiare le
relazioni per tt0. Diciamo che:
i) x =O(y) quando esistono un numero Med un intorno Jdi t0tali che:
tIJ kx(t)k Mky(t)k.
ii) x =o(y) quando ky(t)k 6= 0 per t6=t0in un intorno di t0e inoltre
lim
tt0
kx(t)k
ky(t)k= 0 .
In queste definizioni le due funzioni x(t) e y(t) potrebbero avere valori in spazi di
dimensione diversa. In particolare, y(t) potrebbe essere una funzione a valori in R.
Se y(t) prende valori in Red `e costantemente uguale ad 1, la condizione x=o(1)
vul dire che x(t) `e un infinitesimo (sottinteso, per tt0).
La derivabilit`a
104 CAPITOLO 3. LO SPAZIO LINEARE NORMATO RN
Sia t0punto interno di I. Si dice che un vettore l`e la derivata di x(t) quando
l= lim
tt0
x(t)x(t0)
tt0
.
La derivata si indica con uno dei soliti simboli,
dx(t0)
dt,x(t0),˙
x(t0), Dx(t0), Dt0xecc.
Se tindica il tempo e se x(t) indica la posizione di un punto all’istante t, allora il
quoziente
x(t)x(t0)
tt0
indica la velocit`a media del punto, nell’intervallo di tempo (t0, t); e quindi la derivata si
interpreta come velocit`a del punto all’istante t.
Usando le disuguaglianzein (3.3), si vede che
Teorema 116 La funzione x(t)`e derivabile in t0se e solo se ciascuna sua componente `e
derivabile in t0e inoltre
x(t0) =
x
1(t0)
x
2(t0)
.
.
.
x
n(t0)
.
Dunque, una funzione derivabile in un punto t0`e ivi continua.
In modo del tutto analogo si definiscono le derivate direzionali.
Le usuali regole di calcolo delle derivate si possono applicare alle singole componenti del
vettore x(t) e quindi, per esempio, vale ancora la propriet`a di linearit`a della derivata:
Dt0{x(t) + y(t)}=x(t0) + y(t0).
Teorema 117 Siano x(t)ed y(t)derivabili in t0. I prodotti scalare e vettoriale9sono
derivabili in t0e valgono le uguaglianze
d
dt[x(t)·y(t)] = x(t)·y(t) + x(t)·y(t),
d
dt[x(t)y(t)] = x(t)y(t) + x(t)y(t).
Dim.Proviamo l’asserto per il prodotto vettoriale.
Bisogna calcolare
lim
h0
x(t+h)y(t+h)x(t)y(t)
h.
Aggiungendo e sottraendo al numeratore x(t)y(t+h) si vede che la derivata `e uguale a
lim
h0
x(t+h)x(t)
hy(t+h) + lim
h0x(t)y(t+h)y(t)
h=x(t)y(t) + x(t)y(t)
9ricordiamo, definito solo in R3.
3.7. FUNZIONI DA RIN RN105
perch`e
lim
h0y(t+h) = y(t)
perch´e la funzione y(t), essendo derivabile, `e anche continua
La dimostrazione per il prodotto scalare `e simile.
Osservazione 118 Nella regola per la derivata del prodotto vettoriale i fattori non possono
scambiarsi; invece la derivata del prodotto scalare non dipende dall’ordine dei fattori.
In particolare:
Teorema 119 Sia x(t)una funzione derivabile a valori in Rne tale che kx(t)k 1. Allora,
x(t)x(t).
Dim. Infatti, derivando i due membri dell’uguaglianza
1 = kx(t)k2=x(t)·x(t)
si trova
2x(t)·x(t)0
ossia
x(t)x(t).
Ovviamente, se x(t) `e derivabile in t0, vale la prima formula degli incrementi finiti
x(t) = x(t0) + x(t0)(tt0) + o(tt0).
Osservazione 120 Va esplicitamente notato che la seconda formula degli incrementi finiti,
ossia il Teorema di Lagrange, NON vale. Per rendersi conto di ci`o, consideriamo la fun-
zione x(t) = x(t)i+y(t)j. Il Teorema di Lagrange pu`o applicarsi alle due componenti
separatamente, ottenendo
x(t)x(t′′) = x(c1)(tt′′), y(t)y(t′′) = y(c2)(tt′′)
e generalmente c16=c2.
Se le singole componenti di x(t) sono ciascuna derivabile 2 volte, potremo introdurre le
derivate seconde e, in generale, le derivate k-me in t0. Se ciascuna componente ammette k
derivate in t0si pu`o anche scrivere la formula di Taylor con resto in forma di Peano,
x(t) = x(t0) +
k
X
j=1
x(j)(t0)
j!(tt0)j+o(tt0)k.
Integrale
Se tx(t) `e definita su [a, b] e ciascuna sua componente `e integrabile, si definisce Rb
ax(t) dt
come quel vettore che ha per componenti i numeri Rb
axi(t) dt.
106 CAPITOLO 3. LO SPAZIO LINEARE NORMATO RN
Capitolo 4
Funzioni da Rnin Rm
Studiamo ora le funzioni di pi`u di una variabile; ossia funzioni
F(x)
a valori in Rm, della variabile xRn, in generale con n6=m. Ovviamente, le prime
propriet`a da studiare saranno le propriet`a relative ai limiti ed alla continuit`a. Come ve-
dremo, non si incontrano situazioni sostanzialmente diverse da quelle delle funzioni da R
in R(per`o le propriet`a relative agli estremi saranno tipiche delle funzioni a valori reali).
Differenze profonde si troveranno invece nello studio della differenziabilit`a.
4.1 Limiti e continuit`a
Ricordiamo che col simbolo krkintendiamo la norma di r, senza esplicitamente indicare la
dimensione del vettore. Per esempio,
se r=xRallora krk=x2=|x|;
se r= (x, y) allora krk=px2+y2;
se r= (x, y, z) allora krk=px2+y2+z2.
Se vorremo specificare che la norma `e quella di Rnallora scriveremo
krkRn.
Sia F(r) una funzione definita su un insieme di Rn, a valori in Rme sia r0un punto
di accumulazione di Ω.
107
108 CAPITOLO 4. FUNZIONI DA RNIN RM
Diremo che
lim
rr0
F(r) = L
Se per ogni ǫ > 0esiste un intorno Iǫ(r0) del punto r0tale che
per ogni r Iǫ(r0), r6=r0si ha
kF(r)LkRm< ǫ .
In simboli:
ǫ > 0Iǫ(r0)| r(Iǫ(r0) {r0}) = kF(r)LkRm< ǫ .
Se L= 0 allora si dice che la funzione F(r) `e infinitesima per rr0.
Se accade che F(r) `e definita in r0e se inoltre limrr0F(r) = F(r0), allora si dice
che F(r) `e continua in r0.
Si noti che la definizione di limite e quella di continuit`a sono formalmente analoghe a
quelle note per funzioni di una variabile. la differenza importante da tener presente `e che ora
il simbolo Iǫ(r0)indica una palla aperta di centro r0.
E’ un po diversa la definizione dei limiti infiniti o per rtendente ad infinito, perch´e non
si definisce il limite “direzionale”. Piuttosto, si definisce
Sia un insieme illimitato. Si dice che
lim
krkRn+F(r) = L
se per ogni ǫ > 0esiste δtale che se
krkRn> δ er si ha
kF(r)LkRm< ǫ .
Sia r0punto di accumulazione di Ω. Si
dice che
lim
rr0kF(r)kRm= +
se per ogni ǫ > 0esiste δ > 0 tale che se
rΩ, r6=r0ekrr0kRn< δ si ha
kF(r)kRm> ǫ .
In queste definizioni, per completezza, abbiamo usato gli indici RneRmper indicare
esplicitamente gli spazi nei quali le norme vanno lette; da ora in poi per`o ometteremo tali
indici.
Osservazione 121 Una funzione F(r) da Rnin Rm`e infinitesima (per rr0oppure per
|r| +) se e solo se kF(r)k`e infinitesima come funzione da Rnin R.
Si rileggano i teoremi sui limiti delle funzioni di una variabile, identificando quelle dimostra-
zioni che, grazie alle propriet`a della norma, si ripetono senza alcuna modifica nel caso delle
funzioni di pi`u variabili. Naturalmente non rientrano tra queste quelle dimostrazioni che
dipendono dall’ordine tra i numeri reali, come il teorema delle funzioni monotone e le sue
conseguenze. Sottolineiamo che in particolare valgono:
4.1. LIMITI E CONTINUIT `
A109
1. Il teorema di unicit`a del limite;
2. il teorema di limitatezza locale;
3. i teoremi che correlano i limiti e la continuit`a con le operazioni. Naturalmente, tra
funzioni a valori vettoriali non si fanno divisioni; e il teorema del prodotto va applicato
al prodotto scalare o anche, quando m= 3, al prodotto vettoriale: i prodotti scalari e
vettoriali di funzioni continue sono funzioni continue;
4. i teoremi relativi ai limiti di funzioni composte;
5. per funzioni a valori in R, il teorema di confronto per i limiti e il teorema di perma-
nenza del segno;
6. il teorema di confronto per gli infiniti e gli infinitesimi.
In particolare, vale
Lemma 122 Sia
lim
rr0
F(r)
krr0k= 0 .
Sia
lim
tt0
r(t) = r0
ed esista un intorno di t0su cui la funzione r(t)non prende valore r0. In tal caso vale
lim
tt0
F(r(t))
kr(t)r0k= 0 .
Notiamo un caso particolare del teorema sulla continuit`a delle funzioni composte, gi`a
usato nel corso di Analisi Matematica 1, trattando le equazioni differenziali:
Teorema 123 Sia f(x)un funzione da Rnin Rm, continua su un insieme . Sia x(t)
una funzione continua della variabile reale t[a, b], a valori in . La funzione composta
f(x(t)) `e continua su [a, b].
Come si `e detto, una funzione che ha limite zero (per rr0) si chiama ancora un
infinitesimo (per rr0); e si pu`o istituire un confronto tra gli infinitesimi, esattamente
come nel caso di funzioni di una variabile. Per esempio, il simbolo
F= o( krr0k)
significa
lim
rr0
kF(r)k
krr0k= 0 .
Usando il linguaggio degli infinitesimi, possiamo enunciare:
Teorema 124 Si ha
lim
rr0
F(r) = L
se e solo se la funzione F(r)L`e infinitesima per rr0.
Infine, notiamo che le disuguaglianze (3.3) permettono di provare:
110 CAPITOLO 4. FUNZIONI DA RNIN RM
Teorema 125 Siano Fi(r)le componenti della funzione F(r)da Rnin Rm. Si ha limrr0F(r) =
Lse e solo se per ogni indice ivale limrr0Fi(r) = Li, ove Lisono le componenti del vettore
L.
Si enunci il risulato analogo per i limiti per krk +.
Nonostante che abbiamo insistito sulla completa corrispondenza che intercorre tra de-
finizioni e teoremi in una e pi`u variabili, bisogna sottolineare una importante dissimmetria,
che illustriamo con riferimento a funzioni da R2in R2. Sia quindi
F(x, y) = f(x, y)i+g(x, y)j.
Da
|f(x, y)| kF(x, y)k |f(x, y)|+|g(x, y)|
|g(x, y)| kF(x, y)k |f(x, y)|+|g(x, y)|
si vede che F(x, y)`e infinitesima se e solo se ambedue le sue componenti lo sono; `e continua se
e solo se ambedue le sue componenti lo sono; ossia, come asserito dal Teorema 125, limiti e
continuit`a possono studiarsi esaminando separatamente le due componenti dei valori assunti
dalla funzione, ossia le due componenti f(x) ed g(x) di F(x). Ci`o non accade nello spazio
di partenza; ossia le due componenti xed ynon possono trattarsi separatamente. Per vedere
questo, basta considerare una sola delle componenti di F(x, y), per esempio la funzione a
valori reali f(x, y). La funzione
φ(x) = lim
yy0
f(x, y) (4.1)
pu`o essere definita per ogni x, e pu`o esistere limxx0φ(x); per`o tale limite `e in generale
diverso da lim(x,y)(x0,y0)f(x, y), come mostra l’esempio seguente:
Esempio 126 Sia
f(x, y) = 1 se |x|<|y|
0 se |x| |y|.
La funzione f(x, y) `e priva di limite per (x, y) tendente a zero, mentre
lim
x0lim
y0f(x, y)= 0 ,lim
y0hlim
x0f(x, y)i= 1 .
Si veda la figura 4.1.
Pu`o anche accadere che esista
lim
(x,y)(x0,y0)f(x, y)
ma che non esista il limite che definisce φ(x) in (4.1), come mostra l’esempio seguente:
Esempio 127 Sia
f(x, y) = x[sgn(y)] .
Essendo |f(x, y)| |x|, il teorema di confronto dei limiti mostra che
lim
(x,y)(0,0) f(x, y) = 0 ;
4.1. LIMITI E CONTINUIT `
A111
Figura 4.1: La funzione dell’esempio 126
−3 −2 −1 0 1 2 3
−3
−2
−1
0
1
2
3
x
y
1 1
0
0
1 1
0
0
ma,
lim
y0f(x, y)
esiste soltanto se x= 0.
Infine, ricordiamo che successione `e il termine che si usa per designare una funzione
definita sui numeri naturali. Una successione a valori in Rmsi indicher`a col simbolo (rn) o,
pi`u frequentemente {rn}1.
Come nel caso particolare delle successioni a valori reali, le definizioni e i teoremi sui
limiti delle successioni sono casi particolari di quelli relativi alle funzioni.
4.1.1 Funzioni continue su insiemi
E’ possibile provare l’analogo del Teorema di Bolzano-Weierstrass: ogni successione limitata
a valori in Rnammette sottosuccessioni convergenti.
1se si usa il simbolo con la parentesi graffa, si deve fare attenzione a capire quando si
indica la successione oppure quando se ne vuole indicare l’insieme immagine.
112 CAPITOLO 4. FUNZIONI DA RNIN RM
Un insieme si dice compatto , quando ogni successione in ammette sottosuccessioni
convergenti a punti di Ω. Si pu`o ancora provare:
Teorema 128 Un insieme `e compatto se e solo se `e limitato e chiuso.
Grazie a ci`o, si prova l’analogo del Teorema di Weierstrass con la medesima dimostra-
zione vista per funzioni di una variabile.
Diremo che:
1. un punto r0`e punto di minimo, o di massimo , per una funzione f(r)a valori reali,
se vale, rispettivamente,
f(r)f(r0) oppure f(r)f(r0)
per ogni rΩ;
2. diremo che la funzione F(r), da Rnin Rm`e uniformemente continua se per ogni
ǫ > 0 esiste δ > 0 tale che
r,r0,krr0k< δ implica kF(r)F(r0)k< ǫ .
Vale:
Teorema 129 Sia f(r)una funzione a valori reali definita e continua su un compatto K
Rn. La funzione f(r)ammette in Ksia punti di minimo che punti di massimo.
Il teorema di esistenza degli zeri, equivalentemente quello dei valori intermedi, richiede,
per funzioni di una variabile, di lavorare su intervalli. Gli insiemi aperti e connessi sono gli
analoghi degli intervalli aperti, nel senso che per essi vale il teorema seguente:
Teorema 130 Sia un insieme aperto e connesso e sia f(r)una funzione a valori reali e
continua su . Se r0er1sono due punti di , la funzione assume ogni valore ccompreso
tra f(r0)ef(r1).
Dim.Sia
f(r0) = a , f (r1) = b .
Se `e possibile congiungere r0er1con un segmento contenuto in Ω, si considera la restrizione
della funzione a tale segmento. Si trova una funzione di una sola variabile, continua e definita
su un intervallo, che assume i valori aeb. Dunque assume anche il valore intermedio c.
Nel caso che i due punti si congiungano con una poligonale, ossia, con un numero finito
di segmenti, si procede in modo analogo sui singoli segmenti.
Esistono versioni del teorema precedente anche per funzioni a valori vettoriali. Si veda
per esempio il paragrafo 7.5.2.
4.2 Le propriet`a di differenziabilit`a
Per lo studio di queste propriet`a, conviene separare lo studio delle funzioni a valori in Rda
quello delle funzioni a valori in Rmcon m > 1.
4.2. LE PROPRIET `
A DI DIFFERENZIABILIT `
A113
4.2.1 Il differenziale delle funzioni a valori reali
Quando la funzione f(x, y) dipende da due variabili, la derivata parziale rispetto ad x`e la
funzione sia di xche di ydefinita da
lim
h0
f(x+h, y)f(x, y)
h.
Per indicare questa funzione si usa uno dei simboli
xf(x, y), fx(x, y).
In modo analogo si definisce la derivata parziale rispetto ad ye quella rispetto alle
ulteriori variabili nel caso che la funzione dipenda da pi`u di due variabili.
Si noti esplicitamente che trattando delle equazioni differenziali si `e dovuto richiedere
per`o non la sola esistenza delle derivate parziali, ma la loro continuit`a. In effetti, la sola
esistenza delle derivate parziali `e un concetto molto debole. Infatti:
Esempio 131 L’esistenza delle derivate parziali in un punto (x0, y0), non implica la conti-
nuit`a della funzione in tale punto, come mostra l’esempio seguente:
f(x, y) = 0 se x·y= 0
1 altrimenti,(x0, y0) = (0,0) .
Per contrasto, si ricordi che l’esistenza della derivata prima in un punto di una funzione di
una sola variabile, implica la continuit`a in tale punto. Ricordiamo che la dimostrazione di ci`o
segue dalla prima formula degli incrementi finiti e che praticamente tutte le propriet`a delle
funzioni derivabili di una variabile seguono dalla prima oppure dalla seconda formula degli
incrementi finiti. Dunque, se si vuol sperare di ripetere, per le funzioni di pi`u variabili, una
teoria simile a quella delle funzioni di una variabile, dovremo dare condizioni per l’esistenza
di una formula analoga alla prima formula degli incrementi finiti: ossia, nel caso di funzioni
di due variabili, vorremo condizioni perch`e valga la formula seguente
f(x, y)f(x0, y0) = a(xx0) + b(yy0) + o(k(xx0, y y0)k).(4.2)
Il risultato che vogliamo provare `e:
Teorema 132 Sia f(x, y)una funzione di due variabili. Supponiamo che essa ammetta
ambedue le derivate parziali in ogni punto (x, y) di un intorno di (x0, y0)e che queste siano
continue in tale intorno. Esistono numeri a,bper i quali vale la formula (4.2), ed `e:
a=fx(x0, y0), b =fy(x0, y0).
La dimostrazione `e in appendice.
Passando al limite per dist((x, y),(x0, y0)) tendente a zero in (4.2) si vede che lim f(x, y) =
f(x0, y0). Si ha quindi in particolare:
Corollario 133 Se una funzione ha derivate parziali continue un intorno di (x0, y0), essa `e
continua in (x0, y0).
Argomenti del tutto analoghi valgono per funzioni di tre o pi`u variabili:
114 CAPITOLO 4. FUNZIONI DA RNIN RM
Teorema 134 Una funzione di nvariabili le cui nderivate prime esistono e sono continue
su un aperto `e continua su e per essa vale
f(ξ1, ξ2,...,ξn) = f(x1, x2,...,xn) +
n
X
i=1
(ξixi)fxi(x1, x2,...,xn)
+o(khk),h=(ξ1x1),(ξ2x2),...,(ξnxn).(4.3)
Si chiama differenziale della funzione fin r=x1x2. . . xnla trasformazione
che al vettore (y1,...,yn) associa il numero
n
X
i=1
yifxi(x1, x2,...,xn).
Una funzione dotata di differenziale si chiama differenziabile .
Il vettore
fx1(r)
fx2(r)
.
.
.
fxn(r)
r=
x1
x2
.
.
.
xn
si chiama il gradiente della funzione f(r) e si indica col simbolo f(r). Il simbolo si
legge “grad”, oppure “del” od anche “nabla”.
Usando questo simbolo, la (4.3) si scrive
f(r)f(r0) = f(r0)·(rr0) + o(krr0k).
Si chiama piano tangente al grafico di f(r) nel punto r0= (x1
0,...,xn
0) il grafico della
funzione
rr0+f(r0)·(rr0).
Dunque, l’equazione del piano tangente `e
y=r0+f(r0)·(rr0).
Il vettore f(r0) `e ortogonale al piano tangente. Per definizione, si chiama il vettore normale
al grafico di f(r) nel punto (r0, f(r0)). Si veda la figura 4.2.
Una funzione dotata di derivate parziali prime continue su un aperto si chiama una
funzione di classe C1(Ω) e si scrive fC1(Ω).
Si noti che, per noi, il gradiente `e un vettore colonna. D’altra parte, il differenziale,
come trasformazione da Rn, dotato della base canonica, ad R, si rappresenta mediante una
matrice 1 ×n, ossia mediante un vettore riga. Il vettore riga che rappresenta il differenziale `e
il trasposto del gradiente.
Diciamo infine che si chiamano punti stazionari di f(r) i punti nei quali si annulla il
gradiente f(r). Tali punti si chiamano anche punti estremali o punti critici .
4.2. LE PROPRIET `
A DI DIFFERENZIABILIT `
A115
Figura 4.2: Piano tangente e vettore normale
4.2.2 Regole di derivazione
Dato che la derivata parziale rispetto ad xdi una funzione f(x, y) si calcolano fissando prima
il valore di y, e lavorando con la funzione della sola x, si hanno immediatamente le regole
seguente:
xaf (x, y) = a
xf(x, y)aR;
x (f(x, y) + g(x, y)) =
xf(x, y) +
xg(x, y) ;
x (f(x, y)g(x, y)) =
xf(x, y)g(x, y) + f(x, y)
xg(x, y);
t f(x(t), y) =
x f(x(t), y)x(t).
Per`o nello studio della funzione composta si incontrano casi pi`u complessi: pu`o essere che
sia xche yvengano a dipendere dalla medesima variabile, ossia che si voglia calcolare
d
dtf(x(t), y(t)) .
In questo caso si ha:
Teorema 135 Sia f(x, y) differenziabile in ogni punto di una regione R2e sia
(x(t), y(t)) una funzione derivabile di t(a, b)a valori in . Allora per ogni tsi ha:
d
dtf(x(t), y(t)) = fx(x(t), y(t)) ˙x(t) + fy(x(t), y(t)) ˙y(t).(4.4)
116 CAPITOLO 4. FUNZIONI DA RNIN RM
Dim.Si fissi un punto t0in cui si vuol calcolare la derivata, e si ponga a=fx(x(t0), y(t0)),
b=fy(x(t0), y(t0)). Si ha:
f(x(t), y(t)) f(x(t0), y(t0)) = a[x(t)x(t0)] + b[y(t)y(t0)]
+o(k(x(t)x(t0), y(t)y(t0)) k)
= [a˙x(t0) + b˙y(t0)](tt0) + o(tt0) + o(k(x(t)x(t0), y(t)y(t0)) k).
Notando che
o(k(x(t)x(t0), y(t)y(t0)) k)
k(x(t)x(t0), y(t)y(t0))k·k(x(t)x(t0), y(t)y(t0))k
tt0
si vede che
o(k(x(t)x(t0), y(t)y(t0)) k) = o(tt0).
Infatti o(k(x(t)x(t0), y(t)y(t0)) k)
k(x(t)x(t0), y(t)y(t0))k
tende a zero per il Lemma 122 mentre
k(x(t)x(t0), y(t)y(t0))k
tt0
rimane limitata, come si vede dalla seconda formula degli incrementi finiti applicata sia ad
x(t) che ad y(t):
k(x(t)x(t0), y(t)y(t0))k
tt0
=p( ˙x(c))2+ ( ˙y(d))2.
Sia ora
g(t) = f(x(t), y(t)) .
L’uguaglianza
g(t)g(t0) = [a˙x(t0) + b˙y(t0)](tt0) + o(tt0)
+o(k(x(t)x(t0), y(t)y(t0)) k)
= [a˙x(t0) + b˙y(t0)](tt0) + o(tt0)
mostra che g(t) `e derivabile per t=t0, con
˙g(t) = d
dtf(x(t), y(t)) = a˙x(t0) + b˙y(t0).
Osservazione 136 Si noti che usando il Lemma 122, si `e implicitamente assunto che in un
opportuno intorno di t0la funzione (x(t), y(t)) non prenda valore (x(t0), y(t0)). Si provi per
esercizio che questa condizione pu`o rimuoversi.
Naturalmente, il Teorema 135 si estende al caso di funzioni di nvariabili e, ricordando
il Teorema 134, possiamo enunciare:
4.2. LE PROPRIET `
A DI DIFFERENZIABILIT `
A117
Corollario 137 Sia f(r)C1(Ω) e sia r(t)una funzione di t(a, b)a valori in ,
derivabile. Allora, la funzione composta f(r(t)) `e derivabile su (a, b)ed inoltre:
d
dtf(r(t)) = f(r(t)) ·˙
r(t)
(il simbolo ·indica il prodotto scalare).
Sia ora x=x(u, v), y=y(u, v). Applicando il teorema precedente alla variabile u, con
vfissato, e quindi alla variabile v, con ufissato si trova:
Teorema 138 Sia f(x, y)C1(Ω). Siano x=x(u, v),y=y(u, v)due funzioni definite su
˜
e di classe C1(˜
Ω), a valori in . Valgono le uguaglianze
u f(x(u, v), y(u, v)) = fx(x(u, v), y(u, v))xu(u, v) + fy(x(u, v), y(u, v))yu(u, v)
=f(x(u, v), y(u, v)) ·xu(u, v)
yu(u, v),
v f(x(u, v), y(u, v)) = fx(x(u, v), y(u, v))xv(u, v) + fy(x(u, v), y(u, v))yv(u, v)
=f(x(u, v), y(u, v)) ·xv(u, v)
yv(u, v)
(il punto indica il prodotto scalare di vettori colonna).
Questa formula si chiama anche formula della derivazione a catena .
Consideriamo ora un caso particolare: sia x=tv1,y=tv2. In questo caso, i punti
(x0+tv1, y0+tv2) sono punti di una retta nella direzione del vettore v= (v1, v2), uscente
da (x0, y0). La derivata
d
dtf(x0+tv1, y0+tv2)
calcolata per t= 0 si chiama la derivata secondo il vettore vdella funzione e si indica col
simbolo f
v(x, y).
Dal Teorema 135 segue che, se f(x, y) `e di classe C1,
f
v(x, y) = fx(x, y)v1+fy(x, y)v2=f(x, y)·v.
Se v`e un versore, allora si parla di derivata direzionale nella direzione v.
E’ facile estendere gli argomenti precedenti a funzioni di tre o pi`u variabili.
4.2.3 La direzione del gradiente e la direzione di massi-
ma velocit`a crescita
Sia f(r) una funzione differenziabile a valori reali e sia r0un punto del suo dominio, che
supponiamo aperto. Fissiamo un segmento uscente da r0, dato da
r=r0+tv, t (ǫ, ǫ).(4.5)
118 CAPITOLO 4. FUNZIONI DA RNIN RM
Il numero ǫsi sceglie piccolo, in modo che il segmento sia contenuto nel dominio della
funzione, e v`e un versore.
La derivata in t= 0 della funzione f(r0+tv) rappresenta la velocit`a di variazione dei
valori della restrizione di f(r) al segmento (4.5). E
d
dtf(r0+tv)|t=0 =f(r0)·v.
Questo numero rappresenta la componente di f(r0) lungo ve quindi il suo valore assoluto
`e sempre minore di k∇f(r0)k; `e uguale quando accade che v`e il versore
v=f(r0)
k∇f(r0)k.
In questo caso si ha anche
f(r0)·v=k∇f(r0)k;
ossia, la funzione f(r)ha massima velocit`a di crescita nella direzione e verso di f(r0); nel
verso opposto essa ha massima velocit`a di decrescita.
4.2.4 Le funzioni definite tramite integrali
Sia f(x, y) una funzione continua su un rettangolo chiuso [a, b]×[c, d]. Per ogni fissata
coppia di numeri x[a, b] e y[c, d] si pu`o definire il numero
φ(x, y) = Zy
c
f(x, s) ds .
Si trova cos`ı una seconda funzione definita su [a, b]×[c, d]. Vale:
Teorema 139 La funzione f(x, y)sia continua sul rettangolo chiuso R. Allora, la funzione
φ(x, y)`e continua in R.
Dim.Si scriva
|φ(x, y)φ(x, y)| |φ(x, y)φ(x, y)|+|φ(x, y)φ(x, y)|.
Vogliamo provare che per ogni η > 0esiste σ > 0 tale che se
d((x, y),(x, y)) < σ
allora vale
|φ(x, y)φ(x, y)|< η/2,(4.6)
|φ(x, y)φ(x, y)|< η/2.(4.7)
Studiamo (4.6):
|φ(x, y)φ(x, y)|=Zy
c
f(x, s) dsZy
c
f(x.s) ds
=Zy
c
[f(x, s)f(x, s)] dsZy
c|f(x, s)f(x, s)|ds
Zd
c|f(x, s)f(x, s)|ds .
4.2. LE PROPRIET `
A DI DIFFERENZIABILIT `
A119
La funzione f(x, y) `e continua sul rettangolo limitato e chiuso Re quindi `e uniformemente
continua: per ogni δ > 0 esiste σ > 0 tale che
k(x, y)(x, y)k< σ = |f(x, y)f(x, y)|< δ .
La condizione
k(x, y)(x, y)k< σ
vale in particolare se y=y[c, d] e se |xx|< σ. Dunque,
|xx|< σ = |f(x, s)f(x, s)|< δ =Zd
c|f(x, s)f(x, s)|ds < (dc)δ .
L’assero segue scegliendo
δ=η
2(dc).
Studiamo il secondo addendo (4.7). Per fissare le idee sia y < y:
|φ(x, y)φ(x, y)|=Zy
c
f(x, s) dsZy
c
f(x, s) dsZy
y|f(x, s)|ds .
La funzione f(x, y) `e continua sul rettangolo limitato e chiuso R. Dunque, per il Teorema
di Weierstrass, `e limitata. Sia |f(x, y)|< M . Per la monotonia dell’integrale si ha
|φ(x, y)φ(x, y)| M(yy).
Per avere questa differenza minore di η/2 basta imporre la condizione |yy|< η/2M.
Di conseguenza, dal teorema sulla continuit`a delle funzioni composte, viene ad essere
continua anche la funzione
Zg(x,y)
c
f(x, s) ds ,
per ogni funzione continua g(x, y). Scegliendo in particolare g(x, y) costantemente uguale a
bsi trova:
Teorema 140 Sia f(x, y)continua su [a, b]×[c, d]e sia
φ(x) = Zb
a
f(x, y)dy .
La funzione φ(x)`e continua su [a, b].
Studiamo ora la derivabilit`a:
Teorema 141 Il rettangolo chiuso Rsia interno ad una regione su cui la funzione f(x, y)
ammette derivate parziali continue. Si ha:
xφ(x, y) =
x Zy
c
f(x, s)ds=Zy
c
fx(x, s)ds
y φ(x, y) =
y Zy
c
f(x, s)ds=f(x, y).
120 CAPITOLO 4. FUNZIONI DA RNIN RM
Dim.La seconda uguaglianza `e ovvia perch`e il calcolo dell’integrale e quello della derivata
parziale rispetto ad ysi fanno per ogni xfissata; e quindi di fatto si lavora con funzioni
della sola variabile y.
Proviamo la prima uguaglianza. Scriviamo
φ(x+h, y)φ(x, y)
hZy
c
fx(x, s) ds=Zy
cf(x+h, s)f(x, s)
hfx(x, s)ds .
Vogliamo provare che questa differenza tende a zero per h0. Fissiamo s[c, d] e
scriviamo la formula della media per la funzione della sola variabiled x:
f(x+h, s)f(x, s)
hfx(x, s) = fx(˜x, s)fx(x, s)
ove ˜xdipende sia da hche da s. E’ per`o un punto dell’intervallo (x, x +h).
La funzione fx(x, y) `e uniformemente continua su Re quindi, dato ǫ > 0, esiste δǫ>0
tale che
se |h|< δǫvale |fx(˜x, s)fx(x, s)|< ǫ ;
e quindi,
φ(x+h, y)φ(x, y)
hZy
c
fx(x, s) dsZy
c
ǫds(dc)ǫ .
Ci`o prova che il limite per htendente a zero `e nullo.
Torniamo ora a considerare la funzione
φ(x) = Zd
c
f(x, y) dy .
Essendo questa funzione continua, essa pu`o venir integrata rispetto alla variabile x:
Zb
a"Zd
c
f(x, y) dy#dx
Si chiama questo integrale iterato della funzione f(x, y). Naturalmente, si pu`o anche
introdurre un secondo integrale iterato,
Zd
c"Zb
a
f(x, y) dx#dy
e si pone il problema di sapere se i loro valori coincidano o meno. La risposta affermativa
si vedr`a nel cap. 7.
4.3 Le derivate di ordine superiore
Ricordiamo che le derivate parziali sono a loro volta funzioni di pi`u variabili, e quindi pu`o
accadere che esse siano ulteriormente derivabili. Si possono quindi definire le funzioni
fxx(x, y) =
x
xf(x, y), fxy(x, y) =
x
y f(x, y)fyy (x, y) =
y
y f(x, y)
4.3. LE DERIVATE DI ORDINE SUPERIORE 121
e cos`ı via.
Quando una funzione ammette tutte le derivate parziali continue fino all’ordine kincluso
su un aperto Ω, si dice che essa `e di classe Ck(Ω).
La notazione n
xnf(x, y)
indica la derivata n–ma di f(x, y) rispetto alla variabile x, ossia la derivata ottenuta
tenendo fisso il valore di ye derivando nvolte rispetto ad x. Significato analogo ha il
simbolo n
ynf(x, y).
Le cose sono pi`u complicate se si vogliono le derivate miste, ossia le derivate ottenute de-
rivando alcune volte rispetto ad xe anche rispetto ad yperch´e in generale dovremo tener
conto dell’ordine con cui si eseguono le derivate. Per esempio, in generale
Dx(Dyf(x, y)) =
x
y f(x, y)6=
y
xf(x, y)=Dy(Dxf(x, y)) .
Fortunatamente, ci`o non avviene nei casi pi`u interessanti per le applicazioni. Vale infatti:
Teorema 142 (di Schwarz) Sia f(x, y)una funzione delle due variabili (x, y), di classe
C1un intorno Vdi (x0, y0). Supponiamo che nei punti di Vesistano le derivate miste
Dx(Dyf(x, y)) ed Dy(Dxf(x, y)), e supponiamo che queste siano continue. Allora, per
ogni (x, y)vale
Dx(Dyf(x, y)) = Dy(Dxf(x, y)) .
Esaminando la dimostrazione, in appendice, si vede facilmente che il teorema si estende
al caso di funzioni di pi`u di due variabili.
Grazie a questo teorema, le due derivate miste rispetto ad xed ydi f(x, y) si indicano
semplicemente con i simboli
fx,y(x, y),2
x∂y f(x, y),
senza preoccuparsi dell’ordine di derivazione.
Il Teorema di Schwarz si estende a funzioni di nvariabili, ed a qualsiasi ordine di
derivazione, come segue:
Corollario 143 Sia f(r)Cn(Ω). Si derivi la funzione k1volte rispetto alla prima
componente di r;k2rispetto alla seconda ecc., ma con
k1+k2+...+knn .
La derivata che si ottiene non dipende dall’ordine col quale si eseguono le derivate.
Indicare derivate successive di funzioni di pi`u variabili `e alquanto noioso. Un sim-
bolo comodo si ottiene in questo modo. Sia f(r) una funzione di rRn. Chiamiamo
multiindice un vettore α= (α1, α2,...,αn) le cui componenti sono numeri interi nulli o
positivi. Indichiamo con |α|la lunghezza del multiindice:
|α|=α1+α2+α3+···+αn.
122 CAPITOLO 4. FUNZIONI DA RNIN RM
Col simbolo rαintendiamo:
rα= (rα1
1, rα2
2,...,rαn
n).
Col simbolo
Dαf(r) = |α|
rαf(r)
si intende la derivata di f(r) che si ottiene derivando la funzione f(r) nell’ordine, pri-
ma α1volte rispetto alla prima variabile, poi α2volte rispetto alla seconda variabile, ecc.
(intendendo che se αi= 0 la corrispondente derivata non si esegue).
Il Teorema di Schwarz assicura che se ciascuna derivata di ordine |α|di f(r) `e continua
allora le derivate miste di ordine |α|non dipendono dall’ordine con cui vengono calcolate.
Ci`o giustifica la notazione fCk(Ω), che si usa quando la funzione f(r) ammette tutte le
derivate di ordine ksu Ω, e queste sono continue.
4.3.1 La formula di Taylor per le funzioni a valori reali
Cos`ı come nel caso delle funzioni di una variabile, gli argomenti che hanno condotto alla
prima formula degli incrementi finiti possono iterarsi se la funzione ammette continue le
successive Nderivate. Senza entrare nei dettagli della dimostrazione (simile a quella del
Teorema 132), limitiamoci a dare la formula che si ottiene nel caso delle derivate seconde.
Quando la funzione dipende da due variabili, si trova
f(x, y) = f(x0, y0)
+ [fx(x0, y0)(xx0) + fy(x0, y0)(yy0)]
+1
2fxx(x0, y0)(xx0)2+fxy(x0, y0)(xx0)(yy0)
+fyx(x0, y0)(xx0)(yy0) + fyy(x0, y0)(yy0)2+R(x, y).
e
lim
d((x,y),(x0,y0))0
R(x, y, )
[d((x, y),(x0, y0))]2= 0 ,ossia R(x, y) = o k(xx0, y y0)k2.
(4.8)
Grazie al Teorema di Schwarz, la formula precedente si pu`o scrivere
f(x, y) = f(x0, y0)
+ [fx(x0, y0)(xx0) + fy(x0, y0)(yy0)]
+1
2fxx(x0, y0)(xx0)2+ 2fxy(x0, y0)(xx0)(yy0) + fyy(x0, y0)(yy0)2
+R(x, y).
Questa formula si chiama ancora formula di Taylor arrestata al secondo ordine perch´e il
resto R(x, y) verifica la condizione (4.8).
Naturalmente, aggiungendo i termini con le derivate rispetto ad una terza variabile zsi
trova la formula di Taylor in tre variabili e, in generale, in nvariabili. Si immagina facilmente
che le formule divengano via via pi`u complesse, in particolare se la funzione dipende da pi`u
di due variabili e si vuole scrivere la formula di Taylor di ordine maggiore di 2. E per`o
4.4. GLI ESTREMI 123
possibile scrivere queste formule in modo compatto come segue. Riguardiamo il caso della
formula di Taylor di f(x, y) arrestata all’ordine 2. Si noti che il termine
fx(x0, y0)(xx0) + fy(x0, y0)(yy0)
si pu`o pensare ottenuto come segue:
1
1! (xx0)
x + (yy0)
y f(x, y) = 1
1! [fx(x0, y0)(xx0) + fy(x0, y0)(yy0)] .
Consideriamo ora il termine di ordine 2:
1
2fxx(x0, y0)(xx0)2+ 2fxy(x0, y0)(xx0)(yy0) + fyy(x0, y0)(yy0)2
si pu`o ottenere con questa regola mnemonica: si “calcola”
1
2! (xx0)
x + (yy0)
y 2
scrivendo
1
2! (xx2
0)2
x2+ 2(xx0)(yy0)2
x∂y + (yy2
0)2
y2.
Si “applica” quindi questo alla funzione f(x, y) scrivendo
1
2! (xx2
0)2
x2+ 2(xx0)(yy0)2
x∂y + (yy2
0)2
y2f(x, y)
=1
2! (xx0)2fxx(x0, y0) + 2(xx0)(yy0)fxy(x0, y0) + (yy0)2fxx(x0, y0).
Questa “regola mnemonica” si estende al caso dell’ordine maggiore di 2 e fornisce
l’espressione corretta della formula di Taylor arrestata all’ordine k:
f(x, y) =
k
X
j=0
1
j!(xx0)
x + (yy0)
y j
f(x, y) + o p(xx0)2+ (yy0)2k.
In questa formula si intende che
(xx0)
x + (yy0)
y 0
f(x, y) = f(x0, y0).
L’estensione di questa formula al caso di funzioni dipendenti da pi`u di due variabili `e ovvia.
4.4 Gli estremi
La formula di Taylor, arrestata al primo ordine, ha gi`a dato un’informazione importante.
Infatti, ha condotto a provare che ogni funzione le cui derivate parziali sono ovunque continue
`e essa stessa continua. Daltra parte, nel caso delle funzioni di una sola variabile, la formula
di Taylor si usa per dedurre regole che possono condurre ad identificare i punti di massimo
o di minimo. Si pu`o immaginare che anche per funzioni di pi`u variabili si possa fare uno
studio analogo. Per renderci conto di ci`o, repetiamo la definizione degli estremi:
124 CAPITOLO 4. FUNZIONI DA RNIN RM
Figura 4.3: Un punto di minimo e un punto di sella
0510 15 20 25 30 35 40 45
0
5
10
15
20
25
30
35
40
45
−1
−0.5
0
0.5
1
−1 −0.5 00.5 1−1 −0.5 00.5 1
−2
−1.5
−1
−0.5
0
0.5
1
1.5
2
Definitione 2 Sia f(r) una funzione da RnR. Un punto r0interno al dominio di f(r)
si dice punto di minimo (relativo) per la funzione f(r) se esiste ν > 0 tale che
d(r,r0)< ν =f(r0)f(r).
In modo analogo si definiscono i punti di massimo .
La figura 4.3 (a sinistra) mostra un punto di minimo.
Quando l’intorno di r0coincide con Ω, si parla di estremi assoluti oestremi globali .
E naturalmente a questo caso ci si pu`o ricondurre, sostituendo con tale intorno.
Studiamo ora il caso degli estremi relativi di funzioni di due variabili, che sono interni
al dominio.
Notiamo che se (x0, y0) `e punto di minimo, allora la funzione g(x)della sola variabile x,
g(x) = f(x, y0)
ha minimo in x0ed x0`e punto interno al dominio. Dunque, se `e derivabile, essa ha derivata
nulla in x0, per il Teorema di Fermat. Per definizione, g(x0) = fx(x0, y0).
Se (x0, y0) `e punto di minimo, esso `e anche punto di minimo per la funzione
h(y) = f(x0, y)
e quindi h(y0) = 0; e naturalmente il discorso si ripete se (x0, y0) `e punto di massimo per
f(x, y). Dunque:
Teorema 144 Se la funzione f(x, y)ammette derivate parziali prime nel punto di minimo
(o di massimo) (x0, y0)interno al dominio, esse sono ambedue nulle:
fx(x0, y0) = 0 , fy(x0, y0) = 0 .
Ossia: gli estremi di una funzione vanno ricercati tra i suoi punti stazionari.
Naturalmente, un punto stazionario, ossia un punto nel quale si annulla il gradiente
della funzione, non `e necessariamente un estremo. Una coindizione sufficiente per gli estremi
si vedr`a pi`u avanti. Per`o, in generale la funzione pu`o avere un comportamente quanto mai
vario nei punti nei quali si annulla il gradiente. In particolare definiamo:
4.4. GLI ESTREMI 125
Definitione 3 Si dice che r0`e punto di sella se `e un punto stazionario e se, inoltre, la
funzione f(r)f(r0)cambia segno in ogni intorno r0.
La figura 4.3, a destra, illustra un punto di sella.
Dunque il piano tangente in un punto di minimo o di massimo o di sella (interno al dominio)
`e orizzontale e, se la funzione `e di classe C2, pu`o scriversi:
f(x, y) = f(x0, y0) + 1
2fxx(x0, y0)(xx0)2
+2fxy(x0, y0)(xx0)(yy0) + fyy(x0, y0)(yy0)2+R(x, y)
con R(x, y)/[(xx0)2+ (yy0)2] infinitesima. Per capire se `e possibile ripetere, per
le funzioni di pi`u variabili, uno studio analogo a quello delle funzioni di una variabile,
consideriamo il caso particolare in cui x0= 0, y0= 0, fxx(0,0) = 1, fxy(0,0) = 0, fyy(0,0) =
1. In questo caso,
f(x, y) = f(0,0) + 1
2fxx(0,0)x2+ 2fxy(0,0)xy
+fyy(0,0)y2+R(x, y)
=f(0,0) + (x2+y2)·1
2+R(x, y)
x2+y2.
Il teorema della permanenza del segno mostra che per x2+y2abbastanza piccolo,
1 + 1
2
R(x, y)
x2+y2>0
e quindi f(x, y) ha, in (0,0), un punto di minimo relativo, cos`ı come la funzione di confronto
g(x, y) = x2+y2.
In generale se f(x, y) `e di classe C2e le sue derivate prime sono ambedue nulle in un
punto (x0, y0) dalla formula di Taylor si ha
f(x, y) = f(x0, y0) + g(xx0, y y0) + o(k(xx0, y y0)k2)
e la funzione di confronto g(x, y) ha forma
g(x, y) = 1
2{fxx(x0, y0)(xx0)2+ 2fxy(x0, y0)(xx0)(yy0)
+fyy(x0, y0)(yy0)2}.
Le propriet`a che il punto (x0, y0) ha per le funzioni
g(x, y) = a(xx0)2+ 2b(xx0)(yy0) + c(yy0)2
sono note dai corsi di geometria, caratterizzate mediante la matrice
H=a b
b c .
Con una dimostrazione del tutto analoga a quella vista sopra in un caso particolare,
si prova: Se questa matrice `e definita positiva, il punto `e di minimo; e tale propriet`a `e
126 CAPITOLO 4. FUNZIONI DA RNIN RM
ereditada dalla funzione f(x, y); se la matrice `e indefinita il punto `e di sella, e tale propriet`a
`e ereditata dalla funzione f(x, y); se la matrice `e definita negativa, il punto `e di massimo; e
tale propriet`a `e ereditada dalla funzione f(x, y). Se invece la matrice `e semidefinita positiva
oppure semidefinita negativa, NIENTE PU `
O DIRSI SULLA FUNZIONE f(x, y).
Ricordando i criteri introdotti nei corsi di geometria, per lo studio della definitezza delle
matrici, si ha:
se a > 0 e det H > 0 la matrice H`e definita positiva, ed il punto `e di minimo.
se a < 0 e det H > 0 si ha un punto di minimo.
se ac = 0 ma det H6= 0 la matrice `e indefinita ed il punto `e di sella.
se det H= 0 la funzione g(x, y) ha per grafico un cilindro parabolico e niente pu`o
dirsi della funzione f(x, y).
Questo risultato pu`o estendersi a funzioni di nvariabili. Introduciamo per questo la
matrice hessiana della funzione f(r), r= (x1,...,xn):
H(r) =
fx1,x1(r)fx1,x2(r). . . fx1,xn(r)
fx2,x1(r)fx2,x2(r). . . fx2,xn(r)
.
.
.
fxn,x1(r)fxn,x2(r). . . fxn,xn(r)
.
Vale:
Teorema 145 Siano nulle le derivate parziali prime di f(r)in r0. In tal caso:
se la matrice hessiana `e definita positiva, il punto `e di minimo per f(r);
se la matrice hessiana `e indefinita il punto `e di sella per f(r);
se la matrice hessiana `e definita negativa, il punto `e di massimo per f(x, y).
Invece, NIENTE PU `
O DIRSI se la matrice hessiana `e soltanto semidefinita positiva oppure
negativa.
Osservazione 146 E’ possibile dare ulteriori condizioni necessarie che devono essere sod-
disfatte nei punti di minimo oppure di massimo. Ricordiamo che in un punto di minimo
r0= (x0, y0) le derivate parziali prime devono essere tutte nulle. Questa condizione ne-
cessaria si ottiene facilmente considerando la restrizione della funzione ad una delle rette
coordinate passanti per il punto; ossia, considerando la funzione f(x, y0) si trova che deve
essere fx(x0, y0) = 0.
Se esiste la derivata seconda, fxx(x0, y0) non pu`o essere negativa, altrimenti la funzione
f(x, y0) avrebbe in x0un punto di massimo, invece che di minimo. Dunque, in un punto di
minimo (x0, y0) si deve avere
fxx(x0, y0)0, fyy(x0, y0)0 e quindi anche fxx(x0, y0) + fyy(x0, y0)0.
In un punto di massimo deve aversi invece
fxx(x0, y0)0, fyy(x0, y0)0 e quindi anche fxx(x0, y0) + fyy(x0, y0)0.
4.5. IL DIFFERENZIALE DELLE FUNZIONI A VALORI IN RM127
Questa condizione si generalizza immediatamente al caso di funzioni dipendenti da pi`u
variabili.
Un’ulteriore condizione ancora solamente necessaria ma pi`u precisa `e la seguente: In un
punto di minimo le derivate parziali prime sono nulle e inoltre la matrice hessiana `e definita
positiva oppure semidefinita positiva.
Infatti, se la matrice hessiana fosse definita negativa si avrebbe un punto di massimo,
se fosse indefinita si avrebbe un punto di sella.
Analogamente, In un punto di massimo le derivate parziali prime sono nulle e inoltre la
matrice hessiana `e definita negativa oppure semidefinita negativa.
4.5 Il differenziale delle funzioni a valori in Rm
Sia F(r) una funzione da Rnad Rme sia J(r) una trasformazione lineare da Rnad Rm. Si
dice che la trasformazione lineare J(r) `e il differenziale di F(r) in r0se
kF(r)F(r0)J(rr0)k= o (krr0k).
Ovviamente, la i–ma componente Fi(r) `e una funzione a valori reali e dalla disuguaglianza
|Fi| kFkse F= (F1, F 2,...,Fm)
segue
|Fi(r)Fi(r0)Ji(rr0)k= o(krr0k).
ove Ji(r) `e la i–ma componente di J(r). Segue che una funzione da Rnin Rmche `e
differenziabile ha differenziabile, e quindi continua, ciascuna delle sue componenti:
Teorema 147 Se la funzione F(r)`e differenziabile in r0, essa `e ivi continua.
Viceversa, dalle disuguaglianze (3.3), esiste un Mper cui
kF(r)F(r0)J(rr0)k M
m
X
i=1 kFi(r)Fi(r0)Ji(rr0)k.
Dunque:
Teorema 148 La funzione F(r)`e differenziabile in r0se e solo se ciascuna delle sue
componenti lo `e.
Ricordiamo che le trasformazioni lineari da Rnad Rm(che rappresentiamo rispetto alle
basi canoniche) si rappresentano mediante matrici. Sia Jla matrice della trasformazione
lineare J(r), differenziale in r0della funzione F(r). La sua i–ma riga rappresenta il diffe-
renziale della componente Fi(r) e quindi `e il trasposto del gradiente della funzione Fi(r); e
quindi
J(r0) =
x1F1(r0)
x2F1(r0)...
xnF1(r0)
x1F2(r0)
x2F2(r0)...
xnF2(r0)
.
.
.
x1Fm(r0)
x2Fm(r0)...
xnFm(r0)
128 CAPITOLO 4. FUNZIONI DA RNIN RM
La matrice Jsi chiama la matrice jacobiana della funzione F(r), calcolata in r0. Quando
n=m, il suo determinante si chiamo lo jacobiano della trasformazione.
Per mezzo della matrice jacobiana, possiamo scrivere
F(r) = F(r0) + J(r0)(rr0) + o( krr0k).(4.9)
Quest’uguaglianza si chiama ancora formula degli incrementi niti .
Ovviamente, lavorando per componenti, si potr`a scrivere anche una formula di Taylor
per funzioni da Rnin Rm, su cui non indugiamo.
Come nel caso delle funzioni a valori in R, la sola esistenza delle derivate parziali non
implica e la continuit`a e la differenziabilit`a; ma la continuit`a delle derivate parziali in
un insieme aperto implica la differenziabilit`a, su tale insieme, di ciascuna delle componenti
Fi(r) e quindi di F(r), ossia:
Teorema 149 Le derivate parziali
xiFj(r0)per 1in,1jmesistano continue
in un intorno di r0. Allora, la funzione F(r)`e differenziabile e quindi continua in r0.
Rappresentiamo Rnrispetto alla base canonica e sia Juna trasformazione lineare di
Rnin e. Col medesimo simbolo Jindichiamo anche la matrice che rappresenta la trasfor-
mazione. Si sa che la trasformazione Jtrasforma un parallelepipedo in un altro e l’area del
secondo `e uguale all’area del primo moltiplicata per |det J|.
Consideriamo ora una trasformazione differenziabile da R2in e:
x=x(u, v), y =y(u, v).
Fissiamo un punto r0= (u0, v0) ed un rettangolo Rcon un vertice in r0. L’immagine di R
`e
 x(u, v)
y(u, v),(u, v)R= x(u0, v0)
y(u0, v0)+Juu0
vv0+ouu0
vv0
ove Jindica la matrice jacobiana della trasformazione. Quest’insieme non `e un rettangolo.
E’ un insieme dalla struttura pi`u complicata, ma approssimato dal parallelogramma
˜
R= x(u0, v0)
y(u0, v0)+Juu0
vv0.
Dal paragrafo 3.5
(area di ˜
R) = |det J| · (area di R).
Asserto analogo vale per le trasformazioni di R3.
Quest’osservazione verr`a utilizzata nel paragrafo 7.3.1.
Esempio 150 La figura 4.4 riporta, a sinistra, il rettangolo R= [1,2] ×[1,3/2] del piano
(u, v) e a destra la sua immagine mediante la trasformazione
x=u+ (uv)2, y =v2+uv .
Il parallelogramma a destra `e ˜
R.
4.5. IL DIFFERENZIALE DELLE FUNZIONI A VALORI IN RM129
Figura 4.4: Un parallelogramma, la sua immagine e il parallelogramma che la
approssima
0.5 1 1.5 2 2.5
0.5
1
1.5
2
2 3 4 5 6 7 8 9 10 11
2
2.5
3
3.5
4
4.5
5
5.5
Osservazione 151 Si vede dalla formula degli incrementi finiti che la matrice jacobiana ha,
nel caso delle funzioni da Rnin Rm, lo stesso ruolo che la derivata ha nel caso n=m= 1.
Per questa ragione la matrice jacobiana talvolta si indica anche col simbolo
F(r)
r.
Per esempio, nel caso n=m= 2 e F(x, y) = f(x, y)g(x, y), la matrice jacobiana si
trova anche indicata con la notazione
(f(x, y), g(x, y))
(x, y).
Osservazione 152 (Sulle notazioni) Non esiste una notazione standard per lo jacobiano
o per la matrice jacobiana. Nei testi di meccanica del continuo e di scienza delle costruzioni
lo jacobiano viene indicato col simbolo , come il gradiente. Si faccia attenzione per`o che
se lo spazio d’arrivo ha dimensione 1 allora =“grad” indica un vettore colonna mentre
=“matrice jacobiana” indica un vettore riga2.
Si faccia anche attenzione a questo: nei testi di meccanica del continuo si considerano
funzioni u=u(X, t) con Xeuin R3etR.La notazione u=u(X, t)indica la matrice
jacobiana fatta rispetto al vettore X,ossia
u(X, t) =
u1(X1,X2,X3,t)
X1
u1(X1,X2,X3,t)
X2
u1(X1,X2,X3,t)
X3
u2(X1,X2,X3,t)
X1
u2(X1,X2,X3,t)
X2
u2(X1,X2,X3,t)
X3
u3(X1,X2,X3,t)
X1
u3(X1,X2,X3,t)
X2
u3(X1,X2,X3,t)
X3
.
I testi di meccanica del continuo usano una notazione interessante per le derivate: le
derivate si indicano con indici numerici preceduti da virgola. Per esempio, sia
u(x1, x2, x3) = u1(x1, x2, x3)u2(x1, x2, x3)u3(x1, x2, x3).
2va notato che in certi testi di meccanica del continuo, il gradiente di una funzione a
valori in Rsi intende essere un vettore riga; ossia in tali libri si confonde il gradiente col
vettore che rappresenta il differenziale.
130 CAPITOLO 4. FUNZIONI DA RNIN RM
Il simbolo
ui,j
indica la derivata rispetto ad xjdella componente ui; ossia il numero prima della virgola
specifica la componente e quello dopo specifica la variabile rispetto a cui si deriva. Questo
simbolo si pu`o iterare e per esempio
u2,1 3 =2
x1x3
u2(x1, x2, x3).
4.5.1 Regole di calcolo della matrice jacobiana
Usiamo il simbolo JF(r) per indicare la matrice jacobiana della funzione Fnel punto r. E’
immediatamente evidente che
JAF(r) = AJF(r) per ogni matrice costante A;
JF+G(r) = JF(r) + JG(r).
Supponiamo ora di esprimere rRncome funzione
r=r(u),uRk.
Vale
Teorema 153 (della derivazione a catena ) Sia F(r)di classe C1in una regione di
Rn;r(u)sia di classe C1in una regione ˜
Rk, ed a valori in . Sia G(u) = F(r(u)).
Si ha
JG(u0) = JF(r(u0))Jr(u0).
Il prodotto tra matrici si intende come prodotto righe per colonne.
Omettiamo la dimostrazione.
4.6 Campi vettoriali
Nel trattare le funzioni a valori vettoriali, abbiamo sempre specificato “a valori in Rm”.
Si ricordi che Rm`e uno spazio di vettori liberi, equivalentemente, applicati nell’origine. In
molte applicazioni si devono considerare funzioni che associano ad un punto rdi Rnun
vettore ad ndimensioni, applicato nel punto stesso. Ossia si devono studiare trasformazioni
che trasformano rnella coppia (r,V(r)). Trasformazioni di questo tipo si chiamano campi
vettoriali . E’ comune usare la lettera Vper indicare campi vettoriali. Si scrive cio`e V(r)
sottintendendo che questo vettore `e applicato in r, invece di scrivere la notazione completa,
ma pedante, (r,V(r))
La figura 4.5 illustra il modo con cui usualmente si rappresentano i campi vettoriali: da
ciascun punto si fa uscire una freccia che indica direzione e verso del vettore. La lunghezza
della freccia `e proporzionale al modulo.
Quando si lavora con campi vettoriali, i concetti di continuit`a e di differenziabilit`a sono
concettualmente diversi da quelli incontrati per i vettori liberi, perch´e non si fanno operazioni
tra vettori applicati in punti diversi. Per questo la definizione di continuit`a di un campo
4.6. CAMPI VETTORIALI 131
Figura 4.5: un campo vettoriale
−4 −3 −2 −1 0 1 2 3 4 5
−4
−3
−2
−1
0
1
2
3
4
vettoriale si definisce confrontando il vettore V(r), applicato in rcol vettore PARALLELO
aV(r), anch’esso applicato in rinvece che in r.
Fortunatamente, la somma di vettori applicati nel medesimo punto si fa operando per
componenti, e queste non mutano per spostamenti per parallelismo. Si ha quindi che un
campo vettoriale `e continuo se e solo se sono continue le sue componenti.
Discorso analogo vale per le derivate. Si fissi r0ed un vettore libero v. Si considerino i
vettori
r0+tv
che sono i vettori di una retta parallela a v, passante per r0. Si chiama derivata secondo il
vettore vil limite
DvV(r0) = lim
t0
V(r0+tv)V(r0)
t.
La differenza al numeratore si calcola supponendo di traslare per parallelismo il vettore
V(r0+tv) applicandolo nel punto r0. Dunque, anche il vettore DvV(r0)`e applicato in r0.
Se v`e il versore ei, tale derivata si chiama anche derivata direzionale .
Il teorema di derivazione della funzione composta immediatamente d`a:
Teorema 154 Sia V(r)un campo vettoriale le cui componenti sono funzioni di classe C1.
Esso ammette derivate direzionali in tutte le direzioni, e vale
DvV(r0) = JV(r0)v(4.10)
In questo teorema, il simbolo JV(r0) indica la matrice jacobiana della trasformazione che
al vettore libero rassocia il vettore libero V(r). Il vettore DvV(r0) si intende applicato in
r0.
132 CAPITOLO 4. FUNZIONI DA RNIN RM
4.6.1 Operatori differenziali e campi vettoriali
Abbiamo visto che il gradiente di una funzione a valori scalari `e il vettore
f(r) =
fx1(r)
fx2(r)
.
.
.
fxn(r)
.
Per molte applicazioni, conviene considerare questo un vettore applicato nel punto r. Dun-
que il gradiente associa un campo vettoriale ad una funzione a valori scalari.
Si noti che
[uf(r(u))]= [rf(r(u))]Jr[u]
ove l’apice indica la trasposizione e l’indice sotto il simbolo indica
le variabili rispetto alle quali si calcola il gradiente.
Introduciamo una notazione comoda: sia {e1,...,en}la base canonica di Rn. Scriviamo
in modo formale
=e1
x1+e2
x2+···+en
xn
=e11+e22+···+enn
=
1
2
.
.
.
n
.
Allora il gradiente si ottiene formalmente “moltiplicando” il “vettore per lo “scalare”
f(r), e eseguendo le operazioni di derivazione.
Introdotto il simbolo , viene naturale introdurre le operazioni
· V(r), V(r)
operando formalmente come se si trattasse di prodotti scalari o vettoriali (e quindi la seconda
si definisce solo in R3). La prima d`a la divergenza del campo vettoriale:
divV(r) =
x1V1(r) +
x2V2(r) + ···+
xnVn(r).
Il risultato della seconda operazione, DEFINITA SOLO IN R3,si chiama rotore : il rotore
del campo vettoriale
V(x, y, z) = u(x, y, z)i+v(x, y, z)j+w(x, y, z)k
`e quindi (sottintendendo le variabili indipendenti) il campo vettoriale
rotV= V= (wyvz)i+ (uzwx)j+ (vxuy)k.
4.6. CAMPI VETTORIALI 133
Si noti che, sviluppando formalmente secondo gli elementi della prima riga,
rotV=
i j k
x
y
z
u v w
.
Sia ora u(x, y, z) una funzione due volte derivabile. Calcoliamo prima il gradiente di
u(x, y, z) e poi la divergenza del gradiente:
· (u(x, y, z)) = uxx(x, y, z) + uyy(x, y, z) + uzz (x, y, z).
Usa definire ∆, che si chiama laplaciano , ponendo
u(x, y, z) = uxx(x, y, z) + uyy (x, y, z) + uzz (x, y, z).
Formalmente si scrive
= · .
Si vede facilmente che queste considerazioni valgono per funzioni di qualunque numero di
variabili.
Osservazione 155 (Sulle notazioni) Proseguiamo quanto si `e detto all’osservazione 152.
Facendo intervenire le notazioni dei campi vettoriali, i testi di meccanica del continuo e di
scienza delle costruzioni scrivono la prima formula degli incrementi finiti in questo modo.
Sia u(x) una funzione di tre variabili a valori in R3. Usando la notazione con la virgola”
introdotta all’osservazione 152, la prima formula degli incrementi finiti `e
u(x) = u(0) +
u1,1(0)u1,2(0)u1,3(0)
u2,1(0)u2,2(0)u2,3(0)
u3,1(0)u3,2(0)u3,3(0)
x1
x2
x3
+ o(||x||).
Invece di scrivere in questo modo, viene scritto:
u(x) = u(0) + (x· )u(0) + o(||x||)
ove (x· ) indica un prodotto scalare formale” tre i due vettori colonna xe,
x· =
x1
x2
x3
·
1
2
3
=x11+x22+x33.
Si trova quindi un operatore differenziale che si applica al campo vettoriale u(x), applican-
dolo a ciascuna delle sue componenti:
(x· )u(x) =
x1
x2
x3
·
1
2
3
u(x)
= (x11+x22+x33)u(x) =
x1u1,1+x2u1,2+x3u1,3
x1u2,1+x2u2,2+x3u2,3
x1u3,1+x2u3,2+x3u3,3
proprio come si voleva ottenere.
134 CAPITOLO 4. FUNZIONI DA RNIN RM
4.7 Appendici
4.7.1 Appendice: Rappresentazione di funzioni di due
variabile
In quest’appendice mostriamo alcune funzioni di due variabili a valori reali, ed il modo di
rappresentarle. Sostanzialmente, ci sono tre modi. Descriviamoli prima di tutto in astratto
e poi illustriamoli su opportuni esempi.
Sia f(x, y) una funzione. Il modo pi`u ovvio di rappresentarla consiste nel costruirne il
grafico, ossia nel costruire l’insieme
{(x, y, z)|z=f(x, y)} R3.
Naturalmente questo richiede la costruzione di un modello per esempio di gesso o di plastica.
In pratica rappresenteremo il grafico su un foglio, mediante opportune tecniche di disegno,
che diano l’illusione della profondit`a. Inoltre, talvolta conviene rappresentare, invece della
superficie, solamente una famiglia di linee sulla superficie.
Il secondo metodo consiste nel tagliare il grafico a quota c, e quindi nel proiettare l’in-
sieme intersezione sul piano (x, y). Si disegna cio`e sul piano (x, y),l’insieme delle soluzioni
dell’equazione
f(x, y) = c .
Quest’insieme si chiama insieme di livello . In molti casi3un insieme di livello `e una
“curva” e quindi si parla di curva di livello . Disegnando “numerose” curve di livello si
pu`o avere un’informazione sul comportamento della funzione: per esempio, le curve di livello
sono pi`u fitte dove il grafico della funzione `e pi`u ripido.
Il terzo metodo consiste nel colorare il piano (x, y) colorandolo con colori “freddi”, per
esempio blu, dove i valori della funzione sono pi`u piccoli e con colori caldi, per esempio
rosso, dove la funzione prende valori maggiori.
Molto spesso conviene combinare questi metodi, attribuendo i colori alla superficie o
alle sue curve di livello.
Vediamo ora un esempio. Consideriamo la funzione seguente, il cui grafico `e un para-
boloide di rotazione:
f(x, y) = x2+y2.
La figura 4.6 mostra vari modi di rappresentare il grafico di questa funzione. La figura 4.7
mostra a sinistra la funzione rappresentata mediante le sue curve di livello (e quindi mediante
una rappresentazione sul piano (x, y)) ed a destra il grafico (fatto con fili) della medesima
funzione, sovrapposto alle curve di livello.
Ci`o detto, passiamo ad esaminare alcuni esempi di funzioni.
Funzioni costanti rispetto ad una variabile Pu`o accadere che una fun-
zione f(x, y) sia costante rispetto ad y”; ossia che valga
f(x, y) = f(x, y)
per ogni scelta di ye di y, purch´e la xprenda il medesimo valore a destra ed a sinistra.
3come proveremo al Capitolo 5
4.7. APPENDICI 135
Figura 4.6: Paraboloide di rotazione
0
5
10
15
20
25
0
5
10
15
20
25
0
0.5
1
1.5
2
0
5
10
15
20
25
0
5
10
15
20
25
0
0.5
1
1.5
2
0
5
10
15
20
25
0
5
10
15
20
25
0
0.5
1
1.5
2
0
5
10
15
20
25
0
5
10
15
20
25
0
0.5
1
1.5
2
Vediamo le conseguenze “grafiche” di questa propriet`a. La funzione `e costante sulle
rette verticali del piano (x, y), che pertanto sono tutte contenute in insiemi di livello. Per
esempio la funzione
f(x, y) = sin x(4.11)
ha gli insiemi di livello rappresentati nella figura 4.8 a sinistra. Rette del medesimo colore
corrispondono al medesimo livello e quindi gli insiemi di livello in quest’esempio non sono
“curve”, ma sono insiemi di (infinite) rette verticali.
Dal punto di vista del grafico, il grafico della funzione `e unione di rette orizzontali, e
quindi tutte parallele tra loro.
Il termine superficie verr`a introdotto pi`u avanti, ma `e un fatto che sono “superfici”
i grafici di funzioni (differenziabili). Una superficie che `e unione di rette tutte tra loro
parallele si chiama cilindro . Dunque, i grafici di funzioni f(x, y) costanti rispetto ad una
variabile sono cilindri. Il cilindro corrispondente alla funzione in esame `e nella figura (4.8),
a destra.
Funzioni omogenee Si chiamano funzioni omogenee di grado ν(non necessa-
riamente intero) quelle funzioni che verificano l’uguaglianza
f(rx, ry) = |r|νf(x, y).
136 CAPITOLO 4. FUNZIONI DA RNIN RM
Figura 4.7: Paraboloide di rotazione e sue curve di livello
0 5 10 15 20 25
0
5
10
15
20
25
0
5
10
15
20
25
0
5
10
15
20
25
0
0.5
1
1.5
2
Se ν= 0 la funzione `e costante sulle rette che escono dall’origine, che pertanto appartengono
ad insiemi di livello. Un esempio `e la funzione
f(x, y) = x2y2
x2+y2.
Dato che il denominatore si annulla in (0,0), per evitare difficolt`a di tipo numerico, con-
sideriamola nel quadrati 0,1x1, 0,1y1. La figura 4.9, a sinistra, presenta
le curve di livello della funzione. Come si `e detto, queste sono rette, ma problemi di tipo
numerico vicino a (0,0) (dove si annullano sia il numeratore che il denominatore) provocano
le distorsioni visibili in figura. Il valore della funzione varia da retta a retta, ma rimane
costante sulle singole rette, come mostra la figura 4.9, a destra. In questa figura abbiamo
rappresentato, in verde, anche il piano z= 0.
Se la funzione `e omogenea di grado 1 allora moltiplicando per rsia xche y, il valore
di zviene anch’esso moltiplicato per r. Dunque, se un punto (x0, y0, z0) `e sul grafico,
anche i punti (rx0, ry0, rz0) con r > 0 sono sul grafico. Al variare di r, questi descrivono
semirette passanti per l’origine: il grafico `e unione di semirette passanti per l’origine. Un
insieme unione di rette per un medesimo punto si chiama cono . E quindi il grafico di una
funzione omogenea di grado 1 `e un semicono (con vertice nell’origine).
La figura 4.10, a sinistra, illustra la situazione nel caso della funzione
f(x, y) = xy
x+y.
La figura riporta sia il grafico della funzione sia alcune rette che escono dall’origine e che
appartengono al grafico.
La figura 4.10, a destra, riporta invece il grafico della funzione
f(x, y) = xy
x+y,
4.7. APPENDICI 137
Figura 4.8: La funzione (4.11)
10 20 30 40 50 60 70 80
10
20
30
40
50
60
70
80
−4 −3 −2 −1 01234
−4
−2
0
2
4
−4
−3
−2
−1
0
1
2
3
4
y
x
z
Figura 4.9: Una funzione omogenea
1 2 3 4 5 6 7 8 9 10
1
2
3
4
5
6
7
8
9
10
0
0.2
0.4
0.6
0.8
1
0
0.2
0.4
0.6
0.8
1
−1
−0.5
0
0.5
1
omogenea di grado 1/2. La figura riporta anche una retta per l’origine e per un punto del
grafico che, come si vede, non giace sul grafico.
Simmetrie del grafico, funzioni radiali e superfici di rotazione Il
grafico di una funzione di pi`u variabili pu`o avere propriet`a di simmetria, che estendono
quelle note per le funzioni di una variable. Per esempio, diremo che una funzione f(x, y) `e
dispari se f(x, y) = f(x, y);
pari se f(x, y) = f(x, y).
Come nel caso delle funzioni di una variabile, queste propriet`a corrispondono a certe sim-
metrie del grafico rispetto all’origine. Naturalmente, si possono avere altre possibilit`a che
non si incontrano nel caso di funzioni di una variabile (per esempio, simmetrie rispetto ad
una retta per l’origine, magari ad uno degli assi coordinati).
138 CAPITOLO 4. FUNZIONI DA RNIN RM
Figura 4.10: Funzione omogenea di grado 1/2
00.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 10
0.2
0.4
0.6
0.8
1
0
0.1
0.2
0.3
0.4
0.5
0
0.2
0.4
0.6
0.8
1
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
0
0.05
0.1
0.15
0.2
0.25
0.3
0.35
0.4
0.45
0.5
A noi ora interessa un caso molto particolare di funzione pari di due variabili, ottenuta
a partire da funzioni di una sola variabile.
Si consideri la funzione t7→ f(t) di una sola variabile definita su un intervallo4[a, b]
e a questa si associ la funzione di due variabili
(x, y)7→ fpx2+y2
ossia la funzione
z=fpx2+y2,dom f=n(x, y),px2+y2[a, b]o.
I grafici di queste funzioni hanno una propriet`a particolare. Sia
(x0, y0)dom fpx2+y2ed r0=qx2
0+y2
0.
Il numero r0`e la distanza di (x0, y0) dall’origine. Qualunque altro punto (x, y) che dista r0
dall’origine, ossia per cui
px2+y2=r0
appartiene al dominio della funzione ed inoltre,
fpx2+y2=fqx2
0+y2
0.
Dunque il dominio della funzione `e una corona circolare di centro l’origine (un disco se a= 0,
l’esterno di un disco se a > 0 ed r= +), e tutte le circonferenze di centro l’origine sono
curve di livello della funzione.
Questo si interpreta in questo modo: se il dominio della funzione contiene un
punto P, esso contiene tutta la circonferenza di centro Oche passa per P. Inol-
tre su tale circonferenza la funzione `e costante. Ossia se il punto Pruota su
4facciamo il caso di un intervallo chiuso, ma quello che andiamo a dire si adatta in ogni
caso, anche nel caso che si tratti di una semiretta.
4.7. APPENDICI 139
una circonferenza di centro Oil corrispondente punto del grafico ruota su una
circonferenza parallela al piano x, y, centrata sull’asse delle quote.
Detto in altro modo, ogni piano perpendicolare all’asse delle quote se interseca
il grafico della funzione lo interseca lungo una circonferenza (oppure in un solo
punto).
Una superficie come quella ora descritta si chiama superficie di rotazione.
L’intersezione tra un piano z=z0e il grafico, se non `e vuota, si chiama un parallelo
della superficie mentre l’intersezione tra il grafico ed ogni piano passante per l’asse delle
quote si chiama meridiano della superficie di rotazione: la superficie di rotazione pu`o
anche pensarsi ottenuta ruotando un meridiano intorno all’asse delle quote.
Il grafico nella figura 4.11 mostra una superficie di rotazione, con indicati alcuni paralleli
ed alcuni meridiani.
Figura 4.11: Superficie di rotazione
-0.2
10
0
510
0.2
5
0.4
0
0.6
0
-5 -5
-10 -10
Osservazione 156
Una funzione g(x, y) = fpx2+y2che definisce una super-
ficie di rotazione si chiama anche una funzione radiale. Pi`u in generale, si chiama
funzione radiale ogni funzione su Rnil cui valore in ogni xdel suo dominio dipende
solo da kxk. Tale funzione si esprime come f(kxk) con ffunzione di una variabile
reale.
La funzione gx2+y2`e una funzione radiale, anche se nella sua espressione la radice
non compare. Infatti,
gx2+y2=gpx2+y22.
140 CAPITOLO 4. FUNZIONI DA RNIN RM
Funzioni periodiche Una funzione di due variabili, f(x, y), si dice periodica
quando esiste un vettore v0= (ξ0, η0) tale che
f(x) = f(x+ξ0, y +η0) = f(x, y)
per ogni (x, y) del suo dominio. Un esempio `e la funzione
f(x, y) = (sin x)(sin 2 y).
Se
v= 2πi+πj
si ha
f(x+v) = f(x+ 2π, y +π) = [sin(x+ 2pi)] [sin (2(y+π))] = f(x, y).
La figura 4.12 mette a confronto il grafico della funzione f(x, y), a sinistra, con le sue curve
di livello, a destra.
Figura 4.12: Una funzione periodica
20 40 60 80 100 120 140 160 180
20
40
60
80
100
120
140
160
180
4.7.2 Appendice: Propagazione ondosa
In molte applicazioni si incontrano funzioni della forma
f(φ(x)vt) oppure f(φ(x) + vt)
con v > 0.
In queste applicazioni la variabile tsi interpreta come tempo mentre la variabile x
indica una posizione nello spazio. Dunque la funzione f(φ(x)±vt) descrive una configura-
zione f(φ(x)) che si muove” al passare del tempo e ci`o suggerisce un linguaggio particolare,
che illustriamo con riferimento al caso x=xReφ(x) = xoppure φ(x) = mx.
In queste applicazioni, la funzione f(x) si chiama onda . Potremmo pensare al suo
grafico come alla configurazione all’istante t= 0 di un corpo elastico. Vediamo come si
interpetano le due funzioni
4.7. APPENDICI 141
F1(x, t) = f(xvt), F2(x, t) = f(x+vt)
con v > 0.
Consideriamo la funzione F1(x, t). Fissiamo un valore t0. La funzione xf(xvt0)
si pu`o interpretare in due modi diversi: come la funzione f(x) rappresentata rispetto ad un
sistema di riferimento ottenuto traslando l’origine nella posizione vt0dell’asse x. Dunque
in dietro, perch´e v > 0. Questo modo di intendere le cose `e il pi`u comune nelle applicazioni
geometriche. Invece, nelle applicazioni fisiche e nell’analisi si incontra pi`u frequentemente
un’interpretazione diversa: si pensa ad f(x) ed f(xvt0) come a due diverse funzioni rap-
presentate rispetto al medesimo sistema di riferimento. In tal caso, il grafico della funzione
f(xvt0) `e ottenuto traslando in avanti il grafico di f(x).
Se tsi interpreta come “tempo”, nell’unit`a di tempo il grafico `e andato avanti di una
quantit`a v. Dunque, vrappresenta la velocit`a dello spostamente del grafico. Pensando al
grafico di f(x) come ad un’“onda”, si dice che v`e la velocit`a di propagazione dell’onda.
Le stesse considerazioni si possono ripetere per la funzione F2(x, t) con la sola differenza
che ora il grafico si sposta in dietro (grazie al fatto che vsi `e scelto positivo).
Le considerazioni precedenti suggeriscono di chiamare la funzione F1(x, t) = f(xvt)
onda progressiva mentre la funzione F1(x, t) = f(x+vt) si chiama onda regressiva
(ricordiamo che v > 0).
La figura 4.13 riporta i grafici delle funzioni
e(x+t)2.(4.12)
a sinistra sono riportati i grafici delle funzioni xe(x+t)2nel medesimo sistema di assi
cartesiani (x, y), per diversi valori di t. A destra `e stato costruito il grafico della funzione
di due variabili (x, t)e(x+t)2, nello spazio riferito agli assi cartesiani (x, t, z). Questo
grafico `e stato sezionato con i piani t= 0, t= 2, t= 3 e t= 4, e sono stati disegnati i grafici
risultanti da queste sezioni.
Figura 4.13: La funzione (4.12)
−5 −4 −3 −2 −1 0 1 2 3 4 5
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
t=0
t=2
t=3
t=4
−5
0
5
−5
0
5
0
0.2
0.4
0.6
0.8
1
x
t
z
142 CAPITOLO 4. FUNZIONI DA RNIN RM
Il termine “onda” o “moto ondoso” usato per descrivere la situazione illustrata sopra `e
particolarmente intuitivo nel caso di funzioni f(x) periodiche. La figura 4.14 riporta grafici
analoghi a quelli della figura 4.13, ma questa volta con la funzione
f(x) = sin (mx).(4.13)
Si noti che questa funzione `e periodica di periodo 2π/m. Il valore scelto nella figura per il
periodo `e 3.
Figura 4.14: La funzione (4.13)
−10 −8 −6 −4 −2 0 2 4 6 8 10
−1
−0.8
−0.6
−0.4
−0.2
0
0.2
0.4
0.6
0.8
1
x
y
t=0 t=2
t=3
t=4
−10
−5
0
5
10
−5
0
5
−4
−2
0
2
4
x
t
z
t=0
t=2
t=3
t=4
Il caso in cui f(x) = sin(mx) oppure f(x) = cos(mx) `e particolarmente importante nelle
applicazioni. Le “onde” costruite a partire da queste funzioni si dicono onde armoniche e
in questo caso si usano notazioni e definizioni peculiari che verranno illustrate al paragra-
fo 4.7.2.
Consideriamo ora la funzione F1(x, t) = f(xvt). Questa funzione prende il valore
f(k) in tutti i punti (x, t) nei quali
xvt =k .
Per ogni ksi viene cos`ı a descrivere una retta nei punti della quale l’onda ha il medesimo
valore. Ci`o suggerisce di dare un nome alla quantit`a xvt: questa si chiama la fase
dell’onda progressiva. Al trascorrere del tempo, si rimane sulla stessa fase kse si passa dal
punto xal punto x+vt, ossia se si sposta il punto osservato xin avanti con velocit`a v. Per
questa ragione, il numero vsi chiama anche (e pi`u frequentemente) velocit`a di fase .
Considerazioni analoghe per le onde regressive si lasciano per esercizio.
Si noti che talvolta un’onda viene scritta come
f(hx mt) = f(h(x(m/h)t)) .
In tal caso, la velocit`a di fase `e v=m/h.
Se xR2oppure xR3si incontra un nuovo concetto, che illustriamo con riferimento
axR2,x=x y . Consideriamo le due onde progressive seguenti:
Φ1(x, t) = Φ1(x, y, t) = f(ax +by vt),Φ2(x, t) = Φ2(x, y, t) = fx2+y2vt.
4.7. APPENDICI 143
Ci si pu`o chiedere su quali insiemi del piano (x, y) l’onda ha la medesima fase per ogni fissato
valore di t.Lavorando con la funzione Φ(x, t), fissato t=t0, la fase vale knei punti della
retta
ax +by =k+vt0;
nel caso della funzione Φ2(x, t) fissato t=t0, la fase vale knei punti della circonferenza
x2+y2=k+vt0.
Per questa ragione, l’onda Φ1(x, t) si chiama onda piana mentre l’onda Φ2(x, t) si chiama
onda sferica .
Onde e moto armonico
Ricordiamo che si chiama moto armonico il moto di un punto lungo una circonferenza, se
questo avviene con velocit`a angolare costante.
I punti di una circonferenza di raggio Ahanno coordinate
(Acos(ωt +φ), A sin(ωt +φ)) .(4.14)
Il numero (2π) `e il tempo necessario a descrivere una volta tutta la circonferenza e quindi
T=2π
ω
`e il periodo del moto mentre il suo reciproco
f=ω
2π
si chiama frequenza del moto. La frequenza indica quanti giri (o parti di giro) percorre il
corpo lungo la circonferenza in un’unit`a di tempo.
Il numero di radianti di cui varia la posizione del corpo nell’unit`a di tempo `e ωe per
questo il coefficiente ωsi chiama velocit`a angolare . Dunque,
ω= 2πf .
Dato che ω= (2π)/T , la (4.14) si pu`o anche scrivere (si confronti con l’osservazione 82 dove
per`o il periodo `e 2T)
Acos 2π
Tt , A sin 2π
Tt.
Questo legame col moto armonico suggerisce di chiamare onde armoniche le onde
Acos(kx ωt +φ), A sin(kx ωt +φ)
(e le analoghe onde regressive, il cui esame si lascia per esercizio).
Consideriamo per fissare le idee l’onda progressiva
Asin(kx ωt +φ).
144 CAPITOLO 4. FUNZIONI DA RNIN RM
Il numero Asi chiama l’ ampiezza dell’onda e il numero kx ωt +φsi chiama la fase .
Le due onde
Asin(kx ωt +φ), A sin(kx ωt +ψ)
(con gli stessi valori di ωe di k) si dicono sfasate di φψe questo numero si chiama
sfasamento tra le due onde5.
Per semplicit`a di scrittura, poniamo ora φ= 0. L’onda che si trova all’istante t= 0 `e
l’onda
f(x) = sin kx ,
periodica di periodo 2π/k. Per`o, i fisici riservano i termini “periodo” e “frequenza” alla
variabile tempo. Il numero
λ=2π
k
si chiama invece lunghezza d’onda . Infatti, l’onda prende i medesimi valori nei punti che
distano l’uno dall’altro di 2π/k. Questo pu`o visualizzarsi in questo modo: consideriamo la
funzione
fe(x) = sin kx , x [0,2π/k) = [0, λ).
chiamiamola6“onda elementare”. Allora il grafico di f(x) si pu`o pensare ottenuto giustap-
ponendo i grafici di fe(x+n(2π/k)) per ogni numero intero n. La figura 4.15 illustra ci`o,
usando colori diversi per vedere i grafici che si sono giustapposti.
Figura 4.15: Lunghezza d’onda
−1 −0.5 0 0.5 1 1.5 2 2.5 3 3.5 4
−1
−0.8
−0.6
−0.4
−0.2
0
0.2
0.4
0.6
0.8
1
Il numero di onde elementari che si ripetono nell’unit`a di spazio `e 1 diviso per la
lunghezza dell’onda elementare, che `e k/2π. Il valore
1
λ=k
2π
5pi`u comunemente, per sfasamento si prende un numero dell’intervallo [0,2π). Ci`o pu`o
farsi perch´e le funzioni cos xe sin xsono periodiche di periodo 2π.
6Questo non `e un termine usuale!
4.7. APPENDICI 145
si chiama numero d’onde mentre ksi chiama numero d’onde angolare .
Come si `e detto, i termini “periodo”, “frequenza” e freqenza angolare” si riservano alla
dipendenza dal tempo tdell’onda. Ossia, si riservano alla funzione
tAsin(kx ωt +φ)
con xfissato. La terminologia `e quella gi`a illustrata nel contesto del moto armonico.
Indicando con Til periodo, si ha
T=2π
ω, f =1
T=ω
2π
Il numero ω, che `e la velocit`a angolare del moto armonico, nello studio delle onde
armoniche si chiama frequenza angolare .
Studiamo infine la velocit`a di fase, scrivendo
sin(ωt +kx) = sin kω
kt+x.
La velocit`a di fase, ossia la velocit`a di spostamento dell’onda, `e
v=ω
k=λ
T.
Onde stazionarie
Le onde si “propagano nello spazio, al trascorrere del tempo; questa almeno sembra l’infor-
mazione che pu`o ricavarsi dalle considerazioni precedenti. Per`o, in uno stesso mezzo possono
propagarsi onde diverse. Consideriamo due onde armoniche con la medesima ampiezza
f(xvt) = Acos k(xvt), g(xvt) = Acos m(xνt).
Se le due onde hanno il medesimo numero d’onde, k=me la medesima velocit`a, v=ν,
allora nel mezzo si vede un’onda di ampiezza doppia,
2Acos(kx vt).
Altrimenti, si trova la funzione
(x, t) A[cos k(xvt) + cos m(xνt)] .
Usando le formule di prostaferesi si trova la funzione
2Acos (k+m)x(kv +)t
2cos (km)x+ ( kv)t
2
= 2Acos k+m
2xkv +mν
k+mtcos km
2x+ kv
kmt
Supponiamo ora che la velocit`a di propagazione sia uguale per le due onde, v=ν. In
questo caso si trova il segnale
2Acos km
2(xvt)cos k+m
2(xvt)
146 CAPITOLO 4. FUNZIONI DA RNIN RM
Interpretiamo questa formula: quando i due segnali hanno numero d’onde molto simile,
kme molto grande”, allora ǫ=km`e un numero piccolo relativamente sia a k
che ad m. Tenendo fissa la posizione x, al variare del tempo in questa posizione si vede
passare l’onda cos k+m
2(xvt)cos k(xvt), modulata dal segnale di bassa frequenza
2Acos km
2(xvt).
Se l’onda in questione `e un’onda sonora, nella posizione xsi sente un suono di frequenza
circa uguale a kv/2π, ed ampiezza 2Acos[(km)(xvt)/2] lentamente variabile nel tempo,
con legge periodica di piccola“ frequenza (km)v/(4π).
Si ricordi che la minima frequenza dei suoni udibili dall’orecchio umano `e 16 Herz. Se
accade che (km)v
4π>16
l’orecchio sente comparire un terzo suono”, diverso dai due suoni emessi dagli strumenti, ed
in generale sgradevole. Questo suono si chiama appunto terzo suono osuono di Tartini .
Il caso estremo si ha quando le due onde hanno il medesimo numero d’onde e la medesima
velocit`a, ma si propagano in verso opposto, v=ν. In tal caso si trova
2Acos kx cos kvt . (4.15)
In questo caso niente si propaga: la somma di onde uguali propagantesi in versi opposti
genera una configurazione Acos kx, stazionaria, “modulata” dal segnale sovrapposto cos kvt.
Nonostante che in questo caso niente si propaghi, per conservare la memoria dell’origine
di questo fenomeno, si chiama ancora “onda” la funzione (4.15) e, per sottolineare che
“niente si propaga”, la chiamiamo onda stazionaria .
Interferenza
Consideriamo ora due onde uguali, ossia con la medesima ampiezza, numero d’onde e velocit`a
di propagazione, ma sfasate l’una rispetto all’alta. Ossia consideriamo le due onde
f(xvt) = Acos k(xvt), g(xvt) = Acos k(xvt +φ).
Se queste due onde si propagano nel medesimo mezzo, il segnale propagantesi nel mezzo `e
A[cos k(xvt) + cos k(xvt +φ)] = 2Acos kφ
2cos kx vt +φ
2.
Si ha quindi un segnale di ampiezza 2Acos kφ/2. che pu`o essere nulla.
In pratica, la differenza di fase `e dovuta alla differente lunghezza del cammino percorso
dalle due onde; e quindi in realt`a φvaria cambiando posizione, φ=φ(x). Se l’onda in
questione `e un’onda sonora, in un punto xfissato si sente un suono uguale a quello descritto
da f(x), ma con una diversa intensit`a. L’intensit`a varia al variare della posizione d’ascolto e
in certe posizioni pu`o annullarsi. Questo fenomeno si chiama interferenza delle due onde.
4.7.3 Appendice: Funzioni omogenee
Una funzione f(r), con rRn, si chiama positivamente omogenea di grado ν(anche non
intero) se
f(tr) = |t|νf(r).
4.7. APPENDICI 147
Supponiamo che una funzione omogenea di grado νsia di classe C1per r6= 0. Derivando
rispetto a ti due membri e calcolando le derivate per t= 1, si trova l’uguaglianza
f(r)·r=νf(r)r.(4.16)
Questa relazione si chiama identit`a di Eulero e caratterizza le funzioni omogenee e di classe
C1(per r6= 0) di grado ν. Infatti, consideriamo il caso t > 0. Derivando la funzione
tνf(tr)
si trova
d
dttνf(tr) = νtν1f(tr) + tν(f(tr)·r)
=tν1[νf(tr) + f(tr)·(tr)] .
Per ipotesi la (4.16) vale per ogni r; in particolare vale nel punto tr, ossia vale
νf(t, r) = f(t, r)·(tr) ;
e quindi d
dttνf(tr) = 0 .
Dunque,
tνf(tr) = c , ossia f(tr) = ctν
ove c`e una opportuna costante. Ponendo t= 1 si trova c=f(r) e quindi
f(tr) = tνf(r).
In modo analogo si procede per t < 0 e quindi si trova che la funzione `e omogenea di grado
ν.
4.7.4 Appendice: La dimostrazione del teorema 132
Dim.Per semplicit`a di notazioni, proviamo l’asserto con x0= 0, y0= 0. Fissiamo i punti
xed ye consideriamo la funzione di una sola variabile
φ(t) = f(tx, ty).
Si noti che φ(1) = f(x, y) mentre φ(0) = f(0,0).
Scriviamo
φ(t) = {f(tx, ty)f(tx, 0)}+{f(tx, 0) f(0,0)}.
Consideriamo la funzione della sola variabile t
m(t) = f(tx, 0) .
In quest’espressione, il numero xsi considera come un parametro il cui valore `e fissato.
Applichiamo ad essa la seconda formula degli incrementi finiti: esiste c(0,1) tale che
f(x, 0) f(0,0) = m(1) m(0) = d
dtm(t)|t=c=xfx(cx, 0) .
148 CAPITOLO 4. FUNZIONI DA RNIN RM
Si noti che si sono usate in questo calcolo solamente propriet`a delle funzioni di una variabile
e che, per applicare la seconda formula degli incrementi finiti, si `e usata l’esistenza della
derivata di f(tx, 0) che, a sua volta, implica la continuit`a di f(tx, 0).
Il numero cdipende dalla particolare funzione m(t) usata e quindi, in definitiva, dipende
da x. Dato che c(0,1), si ha |cx|<|x|. Usando ci`o, stimiamo
|x[fx(cx, 0) fx(0,0)] |
px2+y2 |fx(cx, 0) fx(0,0)|.
La condizione |cx|<|x|ela continuit`a della derivata prima mostrano che il limite per (x2+y2)
tendente a zero `e nullo. Dunque vale
f(x, 0) f(0,0) = xfx(0,0) + o(x, y).(4.17)
Consideriamo ora la funzione n(τ), dipendente dai parametri xed y,
n(τ) = f(x, τy).
Applicando a questa la seconda formula degli incrementi finiti, si trova d(0,1) tale
che
f(x, τy)f(x, 0) = n(1) n(0) = d
dτn(τ)|τc=yfy(x, dy).
Si noti che il numero ddipende dalla particolare funzione con cui si lavora, e quindi dai
parametri xed yche la identificano. E’ per`o un numero compreso tra 0 ed 1.
La precedente uguaglianza vale per ogni τ(0,1), in particolare essa vale se come valore
di τsi sceglie 1:
f(x, y)f(x, 0) = yfy(x, dy) = yfy(0,0) + y[fy(x, dy)fy(0,0)] .
L’ultima differenza verifica
|y[fy(x, dy)fy(0,0)]|
px2+y2 |fy(x, dy)fy(0,0)|
e quindi tende a zero per dist((x, y),(0,0)) tendente a zero, per la continuit`a di fye perch`e
0< d < 1. Dunque si pu`o scrivere
f(x, y)f(x, 0) = yfy(0,0) + o(x, y).(4.18)
Sommando la (4.17) e la (4.18) si trova la formula cercata.
Osservazione 157 Si noti che per la dimostrazione `e sufficiente sapere che la funzione
f(x, y) `e derivabile ed ha derivate continue in un intorno di (x0, y0).
4.7.5 Appendice: dimostrazione del teorema di Schwarz
La dimostrazione del teorema di Schwarz `e importante anche perch´e fornisce un’ulterio-
re rappresentazione delle derivate miste. Limitiamoci a provare il teorema assumendo
(x0, y0) = (0,0).
4.7. APPENDICI 149
Mostriamo che, se fx,y(x, y) ed fy,x(x, y) sono continue in un intorno di (0,0) allora si
ha
fxy(0,0) = lim
(h,k)(0,0)
f(h, k)f(h, 0) f(0, k) + f(0,0)
hk =fy,x(0,0) .(4.19)
L’uguaglianza implica in particolare che le derivate miste sono uguali.
Introduciamo la funzione φ(x) = f(x, k)f(x, 0). Vale:
φ(h)φ(0) = f(h, k)f(h, 0) f(0, k) + f(0,0) .
Dal Teorema di Lagrange si ha
φ(h)φ(0) = (c) = h[fx(c, k)fx(c, 0)] .
Il numero cdipende sia da hche da k,c=c(h, k) e verifica
0< c(h, k)< k .
Si usi ora la continuit`a della derivata fx(x, y), l’esistenza in ogni punto della derivata
fxy(x, y) e di nuovo il Teorema di Lagrange per scrivere
φ(h)φ(0) = h[fx(c, k)fx(c, 0)] = hk[fxy(c(h, k), d)] .
Il punto ddipende da ke da c, quindi in definitiva da he da k,d=d(h, k), e verifica
0< d(h, k)< k .
Dunque, dal Teorema di confronto per i limiti,
lim
(h,k)(0,0) c(h, k) = 0 ,lim
(h,k)(0,0) d(h, k) = 0
cos`ı che, per la continuit`a della derivata seconda mista
lim
(h,k)(0,0)
φ(h)φ(0)
hk = lim
(h,k)(0,0) fxy(c(h, k), d(h, k)) = fxy(0,0) .
Ci`o prova la prima uguaglianza in (4.19). Per provare la seconda uguaglianza si intro-
duca la funzione
ψ(y) = f(h, y)f(0, y).
Si procede in modo analogo a quanto fatto per la funzione φ(x) e si trova:
ψ(k)ψ(0) = f(h, k)f(0, k)f(h, 0) + f(0,0)
=f(h, k)f(h, 0) f(0, k) + f(0,0) = φ(h)φ(0) ;
lim(h,k)(0,0) ψ(k)ψ(0)
hk =fyx(0,0) = lim(h,k)(0,0) φ(h)φ(0)
hk =fx,y(0,0)
e quindi fxy(0,0) = fyx(0,0).
Osservazione 158 Si noto che:
per la dimostrazione del teorema di Schwartz basta che la funzione sia di classe C1(V),
con Vintorno di (x0, y0); che esistono le derivate seconde miste in ogni punto di Ve
che queste sono continue in (x0, y0). Le derivate fxx(x, y), fyy (x, y) non intervengono.
Supponiamo che la funzione dipenda da tre o pi`u variabili e che xed ydenotino
due delle variabili. Nel fare le derivate rispetto ad xed y, tutte le altre variabili
vengono tenute costanti; e quindi il teorema di Schwarz vale per funzioni di classe
C1, qualunque sia il numero di variabili da cui la funzione dipende; e per tutte le
coppie (x, y) di variabili tali che le rispettive derivate seconde miste siano continue.
150 CAPITOLO 4. FUNZIONI DA RNIN RM
Capitolo 5
Funzioni implicite ed estremi
vincolati
I termini “curva o “superficie” hanno vari significati, tra loro interdipendenti. E’ comodo
conoscere da subito il significato di curva o superficie parametrica: diremo che una curva `e
definita parametricamente quando `e espressa mediante un’equazione
x=x(t), y =y(t), t (a, b)
(se la curva `e in R3c’`e anche una terza componente, z=z(t)). Una superficie `e definita
parametricamente quando `e definita mediante una trasformazione da una regione di R2
in R3,
x=x(u, v), y =y(u, v), z =z(u, v),(u, v).
Osserviamo che ogni grafico di funzione `e una curva, o una superficie, definita parame-
tricamente. Infatti, considerando la funzione f(x) della variable x(a, b), il suo grafico `e
identificato dalle equazioni
x=t , y =f(t)t(a, b).
In modo analogo, se la funzione dipende da due variabili xed y, il suo grafico `e la superficie
parametrica
x=u , y =v , z =f(u, v).
Se accade che una curva `e grafico di una funzione y=y(x) oppure x=x(y), diciamo
che γ`e una curva cartesiana . In modo analogo si definiscono le superfici cartesiane
come quelle superfici che sono grafici di funzioni di due variabili.
Chiameremo curva” anche l’insieme immagine della parametrizzazione. Al Cap. 6
saremo pi`u precisi su questo punto.
D’altra parte, si sa che la geometria analitica definisce curve e superfici mediante equa-
zioni: l’equazione x2+y2=R2definisce una circonferenza di raggio R(se R > 0; altrimenti
definisce un solo punto). In questo paragrafo vogliamo dare condizioni perch´e un’equazione
definisca una “curva o una “superficie” in un senso che spegheremo, e vogliamo studiare
problemi di massimo e di minimo “vincolati“ a tali curve o superfici.
151
152 CAPITOLO 5. FUNZIONI IMPLICITE ED ESTREMI VINCOLATI
5.1 Insiemi di livello
Sia F(r) una funzione definita su una regione Rned a valori in Re si voglia studiare
l’equazione F(r) = c.
Gli insiemi
Fc={r|F(r) = c}
si chiamano insiemi di livello della funzione F(r). Pi`u precisamente, l’insieme Fcsi chiama
l’insieme di livello c.
Notiamo esplicitamente che l’insieme di livello `e un sottinsieme del dominio della funzione
e non del suo grafico. Per esempio se r= (x, y) l’insieme di livello si ottiene concettualmente
con i tre passi seguenti:
si costruisce il grafico della funzione, che `e in R3;
si taglia il grafico col piano z=c;
si proietta ortogonalmente la sezione ottenuta sul piano (x, y), ottenendo l’insieme
Fc.
L’insieme Fcpu`o avere la natura pi`u varia, come mostrano gli esempi seguenti, nei quali
= R2ec= 0:
Esempio 1. Se F(x, y) = x2+y2+ 1, l’insieme F0`e vuoto.
Esempio 2. Se F(x, y) = x2+y2, l’insieme F0`e costituito dal solo punto 0.
Esempio 3. Se la funzione F(x, y) `e identicamente nulla, F0`e R2;
Esempio 4. Se F(x, y) = (sgnx) + 1 allora F0`e il semipiano {(x, y)|x < 0};
Esempio 5. Se F(x, y) = 1 + (sgny)(sgn x) l’insieme di livello `e l’unione del secondo
e quarto quadrante (assi coordinati esclusi).
Esempio 6. Se F(x, y) = yx2allora F0`e la parabola y=x2, e quindi `e una curva
definita parametricamente da x=t,y=t2.
Esempio 7. se F(x, y) = x2+y21 allora F0`e la circonferenza x2+y2= 1.
Quest’insieme `e anche immagine della curva parametrizzata da
x= cos t , y = sin t , t [0,2π).
Esaminiamo pi`u in dettaglio l’esempio 7. Come si `e visto, si tratta di una curva
parametrica. Se (x0, y0) `e una soluzione, ossia un punto di F0, allora anche (x0,y0) `e
soluzione; e quindi l’insieme delle soluzioni non `e un grafico di funzione (univoca). E’ per`o
vero che se |y0| 6= 0, tagliando l’insieme delle soluzioni con una striscia
y0ǫ < y < y0+ǫ ,
con ǫabbastanza piccolo, si trova il grafico di una funzione y=y(x). Si veda la figura (5.1),
a sinistra.
In questo caso particolare `e facile determinare esplictamente la funzione, perch´e
y(x) = p1x2se y0>0, y(x) = p1x2se y0<0.
5.1. INSIEMI DI LIVELLO 153
Figura 5.1: Esistenza o non esistenza della funzione implicita
−1.5 −1 −0.5 0 0.5 1 1.5
−1.5
−1
−0.5
0
0.5
1
1.5
x
y
x0
y0
−2 −1.5 −1 −0.5 0 0.5 1 1.5 2
−2
−1.5
−1
−0.5
0
0.5
1
1.5
2
Se invece y0= 0, l’insieme
{(x, y)|y0ǫ < y < y0+ǫ} {(x, y)|x2+y2= 1}
non `e grafico di una funzione y=y(x). E per`o grafico di una funzione x=x(y). Per
contrasto, vediamo l’esempio seguente:
Esempio 8 E’ ancora c= 0 mentre la funzione F(x, y) `e
x2y2= 0 .
Quest’equazione `e soddisfatta dai punti di ambedue le bisettrici e l’intersezione delle
bisettrici con un intorno di Onon `e un grafico, e di una funzione y=y(x) e di una
funzione x=x(y), si veda la figura (5.1), a destra.
Si pone quindi questo problema: supponiamo che l’insieme Fcsia non vuoto, e se ne conosca
un suo punto r0. Vogliamo dare condizioni sotto le quali esiste un intorno Wdi r0tale che
WFcsia una curva o una superficie cartesiana. Limitandoci al caso n= 2 oppure n= 3.
Se n= 2, vogliamo capire se l’equazione
F(x, y) = c
si pu`o “risolvere” rispetto per esempio ad y, intendendo xcome “parametro libero otte-
nendo come grafico della funzione (x, y(x)) l’insieme W Fc; Se n= 3, vogliamo capire se
l’equazione
F(x, y, z) = c
si pu`o “risolvere” rispetto per esempio a z, intendendo (x, y) come “parametro libero”
ottenendo come grafico della funzione (z, z(x, y)) l’insieme W Fc.
Quando ci`o accade, si dice che l’equazione considerata definisce implicitamente la fun-
zione, rispettivamente y=y(x) oppure z=z(x, y).
154 CAPITOLO 5. FUNZIONI IMPLICITE ED ESTREMI VINCOLATI
Ci`o si vedr`a nel prossimo paragrafo, nel quale illustreremo anche il caso di un sistema
di due equazioni in tre variabili:
F1(x, y, z) = c1, F2(x, y, z) = c2.
Ci si chiede se, in un opportuno intorno di un punto (x0, y0, z0), `e possibile risolvere questo
sistema rispetto a due “incognite” per esempio yez, intendendo xcome “parametro libero”.
Se ci`o pu`o farsi diremo che si `e definita implicitamente una funzione, che si interpreta come
curva ottenuta come intersezione di due superfici.
5.2 Il teorema della funzione implicita
Ricordiamo il problema: si ha un’equazione (o un sistema di equazioni) di cui si conosce
una soluzione: si vuol sapere se l’insieme delle soluzioni `e, localmente in un intorno di tale
punto, una curva o una superficie cartesiana. Considereremo con qualche dettaglio il caso di
equazioni F(x, y) = cmentre ci limiteremo ad enunciare i risultati in due casi pi`u generali.
5.2.1 Curve piane definite implicitamente
Ricordiamo il problema che si vuole studiare: Consideriamo l’equazione
Sia (x0, y0) una soluzione dell’equazione
F(x, y) = c . (5.1)
Vogliamo dare condizioni sufficienti per l’esistenza di un intorno Wdi (x0, y0) e di una
funzione y=y(x) oppure x=x(y) tali che
{(x, y)W|f(x, y) = c}={(x, y)W|y=y(x)}
oppure
{(x, y)W|f(x, y) = c}={(x, y)W|x=x(y)}.
La condizione che stiamo cercando `e data dal teorema seguente:
Teorema 159 (della funzione implicita) Teorema della funzione implicita Sia F(x, y)
una funzione di classe C1(Ω) e sia (x0, y0). Se
F(x0, y0)6=0
esiste un intorno Wdi (x0, y0)tale che
W{(x, y)|F(x, y) = F(x0, y0)}
`e grafico di una funzione y=y(x), oppure x=x(y). Pi`u precisamente, se Fy(x0, y0)6= 0
allora l’equazione (5.1) definisce implicitamente una funzione y=y(x)di classe C1, e vale
y(x0) = Fx(x0, y0)
F fy(x0, y0);
5.2. IL TEOREMA DELLA FUNZIONE IMPLICITA 155
Se Fx(x0, y0)6= 0 allora l’equazione (5.1) definisce implicitamente una funzione x=x(y)di
classe C1, e vale
x(y0) = Fy(x0, y0)
Fx(x0, y0).
Se ambedue le componenti di F(x0, y0)sono non nulle, allora l’equazione F(x, y) =
f(x0, y0)definisce implicitamente sia una funzione y=y(x)che una funzione x=x(y).
Presentiamo (una parte della) dimostrazione di questo teorema, fissando l’attenzione
sul caso Fy(x0, y0)6= 0. Il punto (x0, y0) `e uno dei punti nel quale vale l’uguaglianza (5.1),
ossia si ha
F(x, y) = c=F(x0, y0).(5.2)
In tal caso, proviamo
Si ha:
Teorema 160 Valga F(x0, y0) = c. Sia F(x, y)di classe C1e sia Fy(x0, y0)6= 0. Sotto
queste condizioni, esistono un intorno Udi x0ed un intorno Vdi y0ed esiste ununica
funzione y=y(x)definita in Ued a valori in Vche ha per grafico l’insieme (5.2) ossia tale
che
y(x0) = y0,
F(x, y(x)) = cper ogni xU,
y(x)V.
Questa funzione `e di classe C1e inoltre
y(x0) = Fx(x0, y0)
Fy(x0, y0).(5.3)
Dim.Per seguire questa dimostrazione, si guardi la figura 5.2. In questa figura, x0=y0= 3
e il punto (x0, y0) `e indicato con un asterisco. Per il teorema della permanenza del segno,
vale Fy(x, y)>0 in un intorno Wdi (x0, y0). Siano ˜
U0un intorno di x0e˜
V0un intorno di
y0tali che se x˜
U0,y˜
V0allora (x, y)W.
Limitiamoci a considerare le coppie (x, y) con x˜
U0,y˜
V0. Siano y1,y2elementi di
˜
V0tali che
y1< y0< y2.
Consideriamo la funzione φ(y) = F(x0, y). Questa funzione `e continua e strettamente
crescente eφ(y0) = c. Dunque, φ(y1)< c,φ(y2)> c.
Il Teorema della permanenza del segno mostra l’esistenza di un intorno U˜
U0di x0
tale che
F(x, y1)< c , F (x, y2)> c xU;
e, per ogni fissato xU, la funzione yF(x, y) `e strettamente crescente. Dunque, per x
fissato, esiste un unico numero y=y(x)˜
Vtale che
F(x, y(x)) = c .
Ci`o prova l’esistenza della funzione y(x).
Omettiamo la dimostrazione della regolarit`a.
156 CAPITOLO 5. FUNZIONI IMPLICITE ED ESTREMI VINCOLATI
Figura 5.2: La dimostrazione del teorema della funzione implicita
−1 0 1 2 3 4 5
−1
0
1
2
3
4
5
f(x0,y0)=c
y1
y2
f(x0,y1)<c
f(x0,y2)>c
Accettando il fatto non provato che y(x) `e derivabile, si derivino i due membri dell’u-
guaglianza
F(x, y(x)) = 0 .
Si trova, per il Teorema 135,
0 = Fx(x, y(x)) + Fy(x, y(x))y(x)
e quindi
y(x) = Fx(x, y(x))
Fy(x, y(x)) .
Calcolando per x=x0si trova la (5.3)
La funzione y=y(x) cos`ı costruita si dece definita implicitamente dall’equazione (5.1).
5.2.2 Superfici definite implicitamente
Consideriamo ora l’equazione
F(x, y, z) = c=F(x0, y0, z0).(5.4)
Vogliamo dare condizioni sotto le quali sia possibile considerare due delle tre variabili co-
me “parametri liberi” e risolvere rispetto alla terza, ottenendo quindi per esempio una
funzione implicita
z=z(x, y)
che interpretiamo come equazione cartesiana di una superficie.
Limitiamoci ad enunciare il teorema che d`a una condizione solamente sufficiente per
l’esistenza della funzione implicita.
5.2. IL TEOREMA DELLA FUNZIONE IMPLICITA 157
Teorema 161 Sia F(r, z)una funzione a valori reali della variabile (r, z)Rn(zindica
l’ultima componente del vettore (r, z)e pertanto `e un numero reale).
Supponiamo che la funzione sia di classe C1e che valga
F(r0, z0) = c , Fy(r0, z0)6= 0 .
Esiste un intorno Wdi (r0, z0)ed esiste un’unica funzione z=z(r)tale che
{(r, z)W|F(r, z) = c=F(r0, z0)}={(r, z)W|z=z(r)}.
La funzione z(r)`e di classe C1ed il suo gradiente `e (indicando con x1,. . . ,xn1le compo-
nenti di r)
1
Fz(r0, z0)Fx1(r0, z0)Fx2(r0, z0). . . Fxn1(r0, z0).
Nel caso particolare r= (x, y) la funzione che si trova `e
z=z(x, y),
ossia la rappresentazione parametrica di una superficie cartesiana.
Osservazione 162 Il teorema precedente si pu`o applicare ad una qualsiasi delle variabili,
purch´e la derivata parziale relativa sia non nulla; per esempio, si potr`a applicare alla prima
invece che all’ultima componente.
5.2.3 Curve intersezione di due superfici
Studiamo ora un sistema di due equazioni in tre incognite. Consideriamo prima di tutto un
esempio:
Esempio 163 Studiamo il problema
x2+y= 1 , y x+z= 0 .
Questo sistema pu`o scriversi come
z=x2+x1, y = 1 x2,
ossia il sistema ha infinite soluzioni, una per ogni valore di x. Diremo che questo sistema
definisce implicitamente le due funzioni z(x) = x2+x1 e y(x) = 1 x2o meglio diremo
che definisce una funzione della variabile reale x, a valori in R2.
Consideriamo in generale il sistema delle due equazioni in tre incognite
f(x, y, z) = c , g(x, y, z) = d . (5.5)
Supponiamo che (x0, y0, z0) risolva questo sistema e, fissato x0, consideriamo la funzione
F(y, z) da R2in R2
F(y, z) = F(x0, y, z)
G(x0, y, z).
158 CAPITOLO 5. FUNZIONI IMPLICITE ED ESTREMI VINCOLATI
Lo jacobiano di questa trasformazione `e
j(x0, y, z) = det Fy(x0, y, z)Fz(x0, y, z)
Fy(x0, y, z)Fz(x0, y, z).
Vale:
Teorema 164 Siano F(x, y, z)eF(x, y, z)funzioni di classe C1e sia
j(x0, y0, z0)6= 0 .
Esiste un intorno Wdi (x0, y0, z0)ed una unica funzione di classe C1
y
z=φ(x)
ψ(x)(5.6)
da Rin R2, tale che
{(x, y, z)W, soluzioni di (5.5)}={(x, y, z)|y=φ(x), z =ψ(x)}.
La derivata della funzione xφ(x)ψ(x)`e
d
dtφ(x0)
ψ(x0)=Fy(x0, y0, z0)Fz(x0, y0, z0)
Gy(x0, y0, z0)Gz(x0, y0, z0)1Fx(x0, y0, z0)
Gx(x0, y0, z0).
Omettiamo la dimostrazione.
Naturalmente diremo che la funzione (5.6) `e definita implicitamente dal sistema di
equazioni (5.5).
5.3 Il teorema della funzione inversa ed i cam-
biamenti di variabili
Il teorema della funzione inversa si pu`o vedere come ulteriore caso del teorema della
funzione implicita, nel caso in cui l’equazione da risolvere sia
F(r) = x,rRn,xRn
ma conviene vederlo come studio dei cambiamenti di variabile .
Cominciamo ad illustrarlo nel caso pi`u semplice n= 1. Abbiamo quindi una funzione
F(x) di una sola variabile xdefinita su un intervallo (a, b) ed ivi di classe C1. Se la sua
derivata non si annulla, si ha F(x)>0 oppure F(x)<0 in ogni punto di (a, b) e quindi
F(x) `e strettamente monotona su (a, b). Dunque `e invertibile.
E’ naturale investigare se l’osservazione precedente possa estendersi al caso di funzioni
di pi`u variabili. Lo studio di questo problema conduce al “teorema della funzione inversa”,
di cui ora illustriamo l’interesse.
Abbiamo visto che talvolta conviene rappresentare i punti di R3mediante coordinate
sferiche oppure, a seconda delle applicazioni, cilindriche. In altri casi si usano coordinate
ellittiche che, sul piano, sono date dalle trasformazioni
x=ra cos θ , y =rb sin θ , r > 0, θ [0,2π).
5.3. IL TEOREMA DELLA FUNZIONE INVERSA ED I CAMBIAMENTI DI VARIABILI159
In generale si ha questa situazione: si hanno due regioni ed di Rn(conviene considerarle
in due copie diverse” di Rn) e una trasformazione invertibile x=F(r) da con immagine
uguale ad Ω. In questo caso i punti di si possono rappresentare, invece che con le loro
coordinate cartesiane, con quelle del punto rdi che univocamente gli corrisponde.
Per esempio lavorando con coordinate polari nel piano,
r= (r, θ)(0,+)×[π, π),x= (x, y) : x=rcos θ
y=rsin θ .
Questa `e una trasformazione invertibile dalla striscia = (0,+)×(π, π) alla regione
che `e il piano R2privato del semiasse {(x, y), x 0}.
Per molte applicazione `e necessario che la trasformazione sia oltre che invertibile anche
differenziabile e con inversa essa stessa differenziabile.
In pratica non `e difficile riconoscere che la trasformazione con cui si lavora `e differen-
ziabile, e spesso anche riconoscere che `e invertibile; `e pi`u difficile calcolare esplicitamente
l’inversa e verificare che essa `e differenziabile. Fortunatamente il teorema seguente d`a una
condizione sufficiente per l’invertibilit`a (si noti: solamente locale) e per la differenziabilit`a
della funzione inversa.
Teorema 165 (teorema della funzione inversa ) Sia x=F(r)una funzione definita
su un aperto Rned a valori in Rn, di classe C1(Ω). Sia r0un punto in cui il
determinante jacobiano `e diverso da zero:
det JF(r0)6= 0 .
Sotto tali condizioni esistono un aperto Acontenente r0ed un aperto Bcontenente x0=
F(r0)con queste propriet`a:
la funzione F(r)`e biunivoca su A, con immagine uguale a B. La restrizione di F(r)
all’aperto Aammette quindi funzione inversa definita sull’aperto B. Indichiamola
col simbolo G(x).
La funzione G(x)`e di classe C1(B);
vale
JG(x0) = [JF(r0)]1,x0=F(r0).(5.7)
Ossia, la matrice jacobiana delle funzione inversa G(x)calcolata in x0`e [JF(r0)]1.
Si noti che, accettando la differenziabilit`a della funzione inversa, la formula per JG(x0)
discende dalla formula di derivazione a catena. Infatti, sia G(x) la funzione inversa di F(r)
e supponiamo di sapere che la funzione G(x) `e differenziabile. Per la definizione di funzione
inversa,
G(F(r)) = r.
La matrice jacobiana della trasformazione rr`e I, la matrice identit`a. Dunque, dalla
formula di derivazione a catena,
I=JG(x0)JF(r0), x0=F(r0)
ossia
JG(x0) = [JF(r0)]1.
E’ importante notare che il teorema della funzione inversa afferma:
160 CAPITOLO 5. FUNZIONI IMPLICITE ED ESTREMI VINCOLATI
1. l’invertibilit`a locale;
2. la regolarit`a dell’inversa.
Invece, l’invertibilit`a su tutta generalmente non vale, come prova il caso delle coordinate
polari nel piano. Per esse, lo jacobiano `e uguale ad re quindi non nullo per r > 0 e qualunque
θ; ma se vogliamo una trasformazione biunivoca dobbiamo imporre a θdi appartenere ad
un intervallo di lunghezza non maggiore di 2π.
Il teorema della funzione inversa ha numerose dimostrazioni, tutte interessanti. In
appendice mostriamo una dimostrazione nel caso di una trasformazione da R2in e, basata
sul teorema della funzione implicita.
In questo capitolo assumeremo che Fsia di classe C1e che gli zeri
di Fsiano isolati.
Ricordiamo che i punti nei quali F(x0, y0) = 0 si chiamano
punti critici della funzione F.
5.4 Ulteriori esempi
Ricordiamo che il Teorema della funzione implicita d`a una condizione sufficiente perch`e un
insieme di livello sia localmente grafico di una funzione: se F(x, y) `e di classe C1, se esiste
(x0, y0) tale che F(x0, y0) = ce se Fy(x0, y0)6= 0, allora esiste un intorno Wdi (x0, y0) la
cui intersezione con l’insieme di livello `e grafico di una (unica) funzione
y=y(x).
Analogo risultato vale se Fx(x0, y0)6= 0. In questo caso la funzione `e x=x(y).
Si ricordi che questa condizione `e solamente sufficiente, e non necessaria, come prova
l’esempio seguente:
Esempio 166 La funzione F(x, y) = (xy)2definisce implicitamente la funzione x=y.
Ma in (0,0) le sue derivate sono identicamente nulle.
Fissiamo un punto (x0, y0) tale che F(x0, y0)6= 0. Chiamiamo curva di livello o
curva definita implicitamente l’insieme
γ={(x, y)|F(x, y) = F(x0, y0)}.
Si noti che potrebbero esistere punti (x, y)γnei quali il gradiente si annulla. Noi abbiamo
richiesto solamente che F(x0, y0)6= 0.
Ovviamente, ogni grafico di funzione `e una curva definita implicitamente dall’equazione
F(x, y) = yf(x) = 0 .
Si ricordi che avevamo gi`a notato che gni grafico di funzione `e anche curva definita parame-
tricamente.
5.4. ULTERIORI ESEMPI 161
Se F(x0, y0)6= 0, esiste un intorno Wdi (x0, y0) tale che Wγ`e grafico di una
funzione. Per esempio di una funzione y=y(x). E quindi possibile definire la tangente in
(x0, y(x0)) = (x0, y0) a tale grafico. Per definizione, la chiamiamo tangente alla curva γ
nel punto (x0, y0).
La retta tangente `e
y=y(x0) + y(x0)(xx0)
=y(x0)Fx(x0, y0)
Fy(x0, y0)(xx0).
Essendo F(x, y(x)) identicamente nulla, la sua derivata `e zero. La derivata per x=x0
`e
F(x0, y0)·1y(x0),
ossia, F(x0, y0)`e ortogonale alla tangente. Per definizione, diremo che il gradiente `e
ortogonale alla curva. Si ha quindi:
Dunque:
Teorema 167 Sia γ`e una curva di livello di una funzione F(x, y)di classe C1. Il gradiente
di F(x, y)in ciascuno dei punti di γche non sono punti cretici di F, `e ortogonale alla curva
stessa.
Per concludere, mostriamo che niente pu`o dirsi nei punti nei quali le condizioni del
teorema della funzione implicita non valgono. Abbiamo gi`a visto (esempio 166) una fun-
zione che non soddisfa alle condizioni del teorema della funzione implicita, ma che definisce
implicitamente una funzione regolare. D’altra parte:
Esempio 168 Consideriamo l’equazione
F(x, y) = y2x2= 0 .
Le due derivate parziali si annullano in (0,0).
L’equazione si risolve facilmente, trovando le soluzioni
y=x , y =x .
La figura 5.3 a sinistra mostra che l’insieme di livello non `e una curva cartesiana in
nessun intorno dell’origine. A destra mostra la superficie (un paraboloide a sella) di cui si
considera l’insieme di livello.
Consideriamo ora l’equazione
F(x, y) = y3x2= 0
Ancora si annullano le due derivate parziali di F(x, y) in (0,0). L’equazione definisce per`o
un’unica funzione,
y=3
x2.
Questa funzione non `e derivabile in y= 0. Il suo grafico `e nella figura 5.4, a destra mentre
a sinistra `e rappresentata la funzione di cui si calcola la curva di livello.
162 CAPITOLO 5. FUNZIONI IMPLICITE ED ESTREMI VINCOLATI
Figura 5.3: Il grafico della funzione y=3
x2
−2 −1.5 −1 −0.5 0 0.5 1 1.5 2
−2
−1.5
−1
−0.5
0
0.5
1
1.5
2
x
y
−1
−0.5
0
0.5
1
−1
−0.5
0
0.5
1
−1
−0.5
0
0.5
1
x
y
Figura 5.4: Esiste la funzione implicita anche se le condizioni del teorema non
sono soddisfatte
−1 −0.8 −0.6 −0.4 −0.2 0 0.2 0.4 0.6 0.8 1
−1
−0.8
−0.6
−0.4
−0.2
0
0.2
0.4
0.6
0.8
1
x
y
−1
−0.5
0
0.5
1
−1
−0.5
0
0.5
1
−2
−1.5
−1
−0.5
0
0.5
1
x
y
5.4. ULTERIORI ESEMPI 163
Figura 5.5: Il grafico della funzione (5.8)
−3 −2 −1 0123
−3
−2
−1
0
1
2
3
0
0.5
1
1.5
2
2.5
3
3.5
10 20 30 40 50 60 70 80 90 100
10
20
30
40
50
60
70
80
90
100
Infine, consideriamo l’esempio seguente
Esempio 169 La funzione che si considera `e
f(x, y) = {[(x2)2+y2][(x+ 2)2+y2]}1/5,(5.8)
il cui grafico `e riportato nella figura 5.5, a sinistra. A destra si riportano alcune delle sue
curve di livello, corrispondenti a varie quote.
Si noti che, per quote basse, la “curva di livello” si spezza in due curve e per quota
uguale a 0 si riduce a due punti (i due punti di minimo della funzione).
La funzione ha un punto di sella di coordinate (0,0, 1). La curva di livello 1 ha un
“punto doppio” in (0,0).
Il teorema della funzione implicita asserisce che se f(x0, y0)6= 0 (ed f(x, y) `e di classe
C1) allora in un intorno di (x0, y0) la curva di livello
f(x, y) = f(x0, y0)
`e grafico di una funzione y=y(x) oppure x=x(y). Si sa gi`a che curva di livello pu`o essere
un grafico anche se f(x0, y0) = 0. L’esempio seguente ribadisce questo fatto.
Esempio 170 La funzione `e
f(x, y) = y3x2y2+x2yx4
e il punto (x0, y0) `e (0,0). E’: f(0,0) = 0. Ci`o nonostante, la curva di livello f(x, y) =
f(0,0) = 0 `e la parabola y=x2perch´e
f(x, y) = (yx2)(y2+x2).
La figura 5.6 mostra a sinistra il grafico di z=f(x, y) e la sua intersezione col piano z= 0;
a destra varie curve di livello della funzione.
164 CAPITOLO 5. FUNZIONI IMPLICITE ED ESTREMI VINCOLATI
Figura 5.6: Gradiente nullo ma curva di livello regolare
−1
−0.5
0
0.5
1
−1
−0.5
0
0.5
1
−40
−30
−20
−10
0
10
2 4 6 8 10 12 14 16 18 20
2
4
6
8
10
12
14
16
18
20
5.4.1 Superfici assegnate in modo implicito e curve in-
tersezione di due superfici
Cos`ı come le curve, anche le superfici possono assegnarsi in modo implicito. Sia F(r) =
F(x, y, z) una funzione di tre variabili, di classe C1, e si voglia risolvere l’equazione
F(x, y, z) = c .
Sia r0= (x0, y0, z0) un punto che verifica l’equazione. Dal Teorema delle funzioni implicite
si sa che se
Fz(r0)6= 0
allora esiste un intorno Wdi r0ed esiste una funzione z=φ(x, y) per cui
{(x, y, z)W|F(x, y, z) = c}={(x, y, z)W|z=φ(x, y)}.
Ossia, localmente l’insieme delle soluzioni `e il grafico della funzione z=φ(x, y).
Discorso analogo vale se una delle altre due derivate parziali `e non nulla.
Di conseguenza, se F(x, y, z) non si annulla, ogni insieme di livello di F(r) `e “fatto
di tanti pezzi di grafici, e quindi di superfici”. Usa considerare anche un tale insieme una
superficie definita per`o in modo implicito .
Si abbiano ora due superfici definite in modo implicito da
f(x, y, z) = c , g(x, y, z) = d .
I punti (x, y, z) che appartengono all’intersezione dei due sostegni risolvono il sistema
f(x, y, z) = c , g(x, y, z) = d . (5.9)
Sia (x0, y0, z0) una soluzione di questo sistema. Se lo jacobiano
det fy(x0, y0, z0)gy(x0, y0, z0)
fz(x0, y0, z0)gz(x0, y0, z0)
5.5. ESTREMI VINCOLATI 165
Figura 5.7: Intersezione di due cilindri
−1
−0.5
0
0.5
1
−1
−0.5
0
0.5
1
0
0.2
0.4
0.6
0.8
1
non `e nullo, si sa (dal Teorema 164) che l’insieme delle soluzioni di (5.9) che appartiene ad
un opportuno intorno Wdi (x0, y0, z0) ha forma
y=φ(x), z =ψ(x)
e quindi `e una curva cartesiana di R3; ossia, localmente l’insieme delle soluzioni di (5.9)
`e una curva. Chiameremo ancora curva l’insieme di tali soluzioni e, pi`u precisamente,
diremo che si tratta di una curva ottenuta come intersezione di due superfici. La figura 5.7
illustra l’intersezione dei due cilindri z=x2ez=y2.
5.5 Estremi vincolati
Diremo che un punto r0, rispettivamente o di γo di Σ, `e un massimo relativo, oppure un
minimo relativo, di g(r)vincolato aγo a Σ quando `e un massimo o un minimo della
restrizione di g(r) alla curva γo, rispettivamente, alla superficie Σ.
In questo capitolo vogliamo dare condizioni necessarie per gli estremi vincolati, che
estendano la condizione “derivata prima nulla nei punti estremi”.
Osservazione 171 Daremo condizioni solamente necessarieche devono venir soddisfatte da
un punto r0di massimo o di minimo vincolato ad una curva γo ad una superficie Σ, definite
implicitamente come curve, rispettivamente superficie, di livello di una funzione di classe
C1. Quindi interessa solamente considerare il comportamento di Fe di gin un intorno di
r0. Dunque, non sar`a necessario assumere che il gradiente di Fsia ovunque diverso da zero.
166 CAPITOLO 5. FUNZIONI IMPLICITE ED ESTREMI VINCOLATI
Baster`a assumere che sia F(r0)6= 0. Per continuit`a, il gradiente F(r) sar`a diverso da
zero in un intorno di r0.
Esamineremo con qualche dettaglio il caso degli estremi vincolati ad una curva piana e, per
sommi capi, il caso degli estremi vincolati ad una superficie ed ad una curva dello spazio.
5.5.1 Estremi vincolati ad una curva piana
Considerando ancora il caso di funzioni di due variabili, vogliamo studiare gli estremi di una
funzione g(x, y) vincolati ad una curva γ; ossia, considerando i punti di minimo1, vogliamo
studiare quei punti (x0, y0) del sostegno di γcon questa propriet`a: esiste un intorno Idi
(x0, y0) tale che se (x, y)Iappartiene anche al sostegno di γallora si ha
g(x0, y0)g(x, y).
Ovviamente, un caso `e banale: se la curva γ`e descritta parametricamente,
x=x(t), y =y(t)t(a, b)
il problema si riduce a studiare i punti di minimo relativo della funzione di una sola variabile
tg(x(t), y(t)). Il caso interessante `e il caso in cui la curva `e descritta in modo implicito.
Il problema di caratterizzare i punti di minimo ha carattere locale e, come si `e detto,
nell’intorno di un punto nel quale il gradiente non si annulla, ogni curva di livello pu`o scriversi
in forma parametrica. Per`o, in pratica, trovarne l’espressione parametrica `e tutt’altro che
facile. Vogliamo quindi dare una condizione necessaria soddisfatta dai punti di minimo, senza
dover esplicitare la curva di livello.
Ricapitolando, `e data una una funzione F(x, y) di classe C1e un punto (x0, y0). Assu-
miamo
F(x0, y0)6= 0 .
E’ data una funzione g(x, y) di classe C1e supponiamo che (x0, y0) sia punto di minimo
della g(x, y) vincolato alla curva di livello
F(x, y) = F(x0, y0).
Una condizione necessaria che deve essere soddisfatta `e data dal teorema seguente.
Teorema 172 Siano F(x, y)eg(x, y)funzioni di classe C1su una regione e sia (x0, y0)
un punto tale che
F(x0, y0)6= 0 .
Sia γla curva di livello
F(x, y) = F(x0, y0).
Sia (x0, y0)un punto di massimo o di minimo di g(x, y), vincolato alla curva γ. In tal
caso esiste un numero λtale che
g(x0, y0) = λF(x0, y0).
1i punti di massimo si trattano in modo analogo
5.5. ESTREMI VINCOLATI 167
Figura 5.8: Estremi vincolati e curve di livello
−1.5 −1 −0.5 0 0.5 1 1.5
−1.5
−1
−0.5
0
0.5
1
1.5
Il numero λsi chiama moltiplicatore di Lagrange e quando si usa il teorema prece-
dente per la ricerca degli estremi vincolati si diche che si usa il metodo dei moltiplicatori di
Lagrange .
Posponiamo la dimostrazione formale del teorema e presentiamone prima di tutto una
giustificazione di tipo geometrico.
Considerazioni geometriche che giustificano il metodo dei molti-
plicatori di Lagrange. Fissiamo l’attenzione sul punto (x0, y0) di γe consideriamo
la curva di livello σdi g(x, y),
σ:g(x, y) = g(x0, y0).
Il punto (x0, y0) appartiene sia a γche a σ.
Supponiamo che la γpassi da una parte all’altra di σ. In questo caso la γpassa da una
parte del piano in cui vale
g(x, y)< g(x0, y0)
ad una parte del piano in cui vale
g(x, y)> g(x0, y0)
e quindi il punto (x0, y0) non `e e di massimo e di minimo.
Dunque, nei punti di massimo e di minimo vincolati, le due curve di livello γeσsi toccano
senza attraversarsi. La fig. 5.8 illustra questo caso.
Usando gli sviluppi di Taylor si prova che le due curve γeσsi attraversano nel loro
punto comune (x0, y0)se le tangenti in tale punto si attraversano. Dunque nei punti di
massimo e di minimo vincolato le due curve devono avere la medesima retta tangente e quindi
la medesima retta normale.
Questo caso `e illustrato dalla figura 5.9 a sinistra mentre la figura 5.9 a destra mostra
che le due curve di livello possono attraversarsi anche nel caso in cui le tangenti coincidono.
168 CAPITOLO 5. FUNZIONI IMPLICITE ED ESTREMI VINCOLATI
Figura 5.9: Grafici tangenti e estremi vincolati
−2 −1.5 −1 −0.5 0 0.5 1 1.5 2
−1
−0.5
0
0.5
1
1.5
2
2.5
3
−3 −2 −1 0 1 2 3
−3
−2
−1
0
1
2
3
Sappiamo che la normale ad una curva di livello `e nella direzione del gradiente della
funzione e quindi nei punti di massimo oppure di minimo vincolato, F(x0, y0)eg(x0, y0)
sono vettori colineari: esiste un numero λtale che g(x0, y0) = λF(x0, y0).
Dunque, studiando il sistema della tre equazioni
F(x, y) = 0
λFx(x, y) = gx(x, y)
λFy(x, y) = gy(x, y)
(5.10)
nelle tre incognite λ,xed y, si determinano dei punti tra i quali necessariamente si trovano
gli estremi vincolati di g(x, y).
Osservazione 173 Gli argomenti di tipo geometrico che abbiamo usato non sono rigorosi e
inoltre fanno intervenire la curva di livello σ. Dunque implicitamente richiedono di lavorare
in punti nei quali il gradiente della funzione g(x, y) non si annulla. Il teorema vale per`o
anche se g(x0, y0) = 0. Infatti, la dimostrazione analitica presentata pi`u avanti non fa uso
di condizioni sul gradiente di g(x, y).
I punti nei quali si annulla il gradiente di g(x, y) si trovano dalle (5.10) scegliendo
λ= 0.
Alcuni esempi
Esempio 174 Si voglia calcolare il punto su una curva piana, pi`u vicino all’origine; ossia
si voglia minimizzare sulla curva la funzione
g(x, y) = x2+y2.
Consideriamo il caso delle quattro curve seguenti:
5.5. ESTREMI VINCOLATI 169
la curva `e implicitamente definita da
y2x+ 1 = 0
ed `e rappresentata in figura 5.10.
Figura 5.10:
0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 5
−2
−1.5
−1
−0.5
0
0.5
1
1.5
2
E’ facile vedere geometricamente che il punto del sostegno pi`u vicino all’origine `e il
punto (1,0) e questo `e l’unico punto per cui esiste un λtale che
y2x+ 1 = 0
1 + 2λx = 0
y+λy = 0 .
Il valore di λ`e 1/2.
Se F(x, y) = (y2x+ 1)2si ha il medesimo problema; ma ora il metodo dei moltipli-
catori di Lagrange non `e applicabile perch`e le derivate parziali di F(x, y) si annullano
contemporaneamente. Tentando ugualmente di scrivere il sistema (5.10) si trova
(y2x+ 1)2= 0
(y2x+ 1) + λx = 0
2(y2x+ 1) + λ= 0 .
Questo sistema non d`a informazioni perch´e scegliendo λ= 0 si vede che ogni (x, y)
per cui y2x+ 1 = 0 risolve le tre equazioni.
Sia invece F(x, y) = x2+y21. Ovviamente, ogni punto della circonferenza minimizza
la distanza. Per`o le due derivate parziali di F(x, y) si annullano in (0,0).
Dato che (0,0) non appartiene alla curva, il metodo dei moltiplicatori di Lagrange
pu`o usarsi. Il sistema (5.10) `e ora
x2+y21 = 0
2x+ 2λx = 0
2y+ 2λy = 0 .
Ogni valore (x, y) per cui x2+y2= 1 risolve questo sistema (con λ=1).
170 CAPITOLO 5. FUNZIONI IMPLICITE ED ESTREMI VINCOLATI
Sia F(x, y) = 2x2+y21. Ancora, ambedue le derivate parziali di F(x, y) si annullano
in (0,0), che per`o non appartiene alla curva. Dunque, il metodo dei moltiplicatori di
Lagrange pu`o usarsi. Il sistema (5.10) diviene:
2x2+y21 = 0
2x+λx = 0
y+λy = 0 .
Le soluzioni sono ora
x= 0 y=±1 con λ=1
y= 0 x=±1/2 con λ=2.
Dato che f(x, y) `e l’ellisse in gura 5.8, i punti (±2,0) sono di minimo mentre (0,±1)
sono di massimo. Il metodo dei moltiplicatori di Lagrange, essendo solo basato sullo
studio delle derivata prima, non permette di distinguere un caso dall’altro.
Infine, applichiamo il metodo dei moltiplicatori di Lagrange per il calcolo dei punti
estremi di una funzione di una sola variabile.
Esempio 175 Sia g0(x) una funzione derivabile della sola variable xR. Introduciamo
la funzione g(x, y) di due variabili, costante rispetto ad y, data da
g(x, y) = g0(x).
Calcolare i punti estremi di g0(x) `e come calcolare i punti estremi della funzione g(x, y)
vincolati alla curva
F(x, y) = 0 ove F(x, y) = y .
Si noti che la funzione F(x, y) `e di classe C1ed ha gradiente non nullo:
F(x, y) = 0
1.
Quindi i punti estremi si possono calcolare mediante il metodo dei moltiplicatori di Lagrange,
ossia risolvendo il sistema seguente nelle tre incognite x,yeλ:
F(x, y) = 0 ossia y= 0
g(x, y) = λF(x, y) ossia g
0(x) = 0 ·λ
0 = 1 ·λ
La prima riga impone di limitarsi a considerare punti dell’asse delle ascisse. Dall’ultima
riga si vede che deve essere λ= 0. La penultima impone di guardare i valori di xper cui
g
0(x) = 0. Si ritrova quindi la condizione che la derivata prima deve annullarsi nei punti
estremi.
5.5. ESTREMI VINCOLATI 171
Dimostrazione analitica del Teorema di Lagrange
Vediamo ora una dimostrazione analitica del metodo dei moltiplicatori di Lagrange, che si
presta a ulteriori generalizzazioni.
Valgano le ipotesi del teorema e sia (x0, y0) un punto di estremo di g(x, y) vincolato alla
curva di livello
F(x, y) = c=F(x0, y0).
Dato che la funzione F(x, y) `e di classe C1e che F(x0, y0)6= 0, l’equazione F(x, y) = c
definisce una curva piana, in un opportuno intorno di (x0, y0) che si pu`o esprime localmente
mediante l’equazione y=y(x) oppure x=x(y). Per fissare le idee supponiamo che valga la
rappresentazione y=y(x) cos`ı che
F(x, y(x)) = c . (5.11)
Il punto (x0, y0) = (x0, y(x0)) `e un punto di minimo vincolato per la funzione g(x, y).
Questo vuol dire che esiste un intorno Idi x0tale che se xIallora vale
F(x, y(x)) = 0 , g(x0, y0)g(x, y(x)) .
Imponendo che sia nulla la derivata prima di g(x, y(x)) per x=x0si trova
0 = dg(x0, y(x0))
dx=gx(x0, y0) + gy(x0, y0)y(x0).
Si ha quindi
0 = gx(x0, y0) + gy(x0, y0)y(x0).(5.12)
Dal Teorema della funzione implicita si sa che
y(x0) = Fx(x0, y0)
Fy(x0, y0).
Sostituendo in (5.12) si trova
gx(x0, y0) + gy(x0, y0)
Fy(x0, y0)Fx(x0, y0) = 0 .
Dunque, posto
λ=gy(x0, y0)
Fy(x0, y0),
si vede che
gx(x0, y0) = λFx(x0, y0).
Anche le derivate rispetto ad yverificano l’uguaglianza analoga,
gy(x0, y0) = λFy(x0, y0),
col medesimo valore di λ.Infatti,
gy(x0, y0)λFy(x0, y0) = gy(x0, y0) + gy(x0, y0)
Fy(x0, y0)Fy(x0, y0) = 0 .
Ci`o completa la dimostrazione.
172 CAPITOLO 5. FUNZIONI IMPLICITE ED ESTREMI VINCOLATI
5.5.2 Estremi vincolati ad una superficie
Siano F(x, y, z) e g(x, y, z) due funzioni di classe C1, definite in un intorno Udi (x0, y0, z0).
Supponiamo che sia F(x0, y0, z0) = c.
Si ricordi che (x0, y0, z0) `e punto di minimo di g(x, y, z), vincolato aF(x, y, z) = cse
F(x, y, z) = cimplica g(x0, y0, z0)g(x, y, z).
La definizione si estende facilmente ai punti di massimo vincolato.
Vale:
Teorema 176 Sia (x0, y0, z0)un punto di minimo o di massimo, vincolato a F(x, y, z) = c.
Supponiamo che il gradiente di F(x, y, z)non si annulli in (x0, y0, z0). Allora esiste un
numero λper cui
λF(x0, y0, z0) = g(x0, y0, z0).(5.13)
Dim.Studiamo il caso del punto di minimo.
Per fissare le idee, supponiamo che sia Fz(x0, y0, z0)6= 0. Si espliciti F(x, y, z) rispetto
alla variabile z.
Il punto (x0, y0, z0) `e di minimo vincolato alla condizione zz(x, y) = 0, ossia, la
funzione
g(x, y, z(x, y))
ha minimo libero in (x0, y0). Dunque, ambedue le sue derivate parziali sono nulle:
xg(x0, y0, z(x0, y0)) = gx(x0, y0, z(x0, y0)) + gz(x0, y0, z(x0, y0))zx(x0, y0) = 0
y g(x0, y0, z(x0, y0)) = gy(x0, y0, z(x0, y0)) + gz(x0, y0, z(x0, y0))zy(x0, y0) = 0 .
Avendo supposto Fz(x0, y0, z0)6= 0, si ha
zx(x0, y0) = Fx(x0, y0)
Fz(x0, y0), zy(x0, y0) = Fy(x0, y0)
Fz(x0, y0)
ossia
gx(x0, y0, z0) + gz(x0, y0, z0)
Fz(x0, y0, z0)Fx(x0, y0, z0) = 0
gy(x0, y0, z0) + gz(x0, y0, z0)
Fz(x0, y0, z0)Fy(x0, y0, z0) = 0 .
Naturalmente vale anche
gz(x0, y0, z0) + gz(x0, y0, z0)
Fz(x0, y0, z0)Fz(x0, y0, z0) = 0 .
Definendo
λ=gz(x0, y0, z0)
Fz(x0, y0, z0)
si trova che vale la (5.13).
5.5. ESTREMI VINCOLATI 173
5.5.3 Estremi vincolati ad una curva dello spazio
Sia F(r) = F(x, y, z) una funzione di classe C1in una regione R3e sia γuna curva
in Ω. Vogliamo dare una condizione necessaria che deve valere se un punto r0`e punto
di estremo di F(r) vincolato alla curva γ. Se la curva γ`e data in forma parametrica il
probema si riduce immediatamente alla ricerca degli estremi di una funzione di una sola
variabile. Quindi consideriamo il caso in cui γ`e data implicitamente, come intersezione di
due superfici:
γ:g1(x, y, z) = c , g2(x, y, z) = d .
Sia r0= (x0, y0, z0) un punto di γ, che `e massimo oppure minimo di F(r) vincolato a γ.
Supponiamo che in r0valga la condizione del teorema della funzione implicita. Privilegiando,
per esempio, la variabile x, supponiamo che si abbia
det g1,y(x0, y0, z0)g1,z(x0, y0, z0)
g2,y(x0, y0, z0)g2,z(x0, y0, z0)6= 0 .(5.14)
Si ricordi che sotto questa condizione la curva γsi rappresenta, in un intorno di (x0, y0, z0),
in forma cartesiana, come
y=y(x), z =z(x)
e
y0=y(x0), z0=z(x0).
Dunque, la funzione della sola variabile x
F(x, y(x), z(x))
ha un punto di estremo in x0e quindi la sua derivata prima `e ivi nulla:
0 = Fx(x0, y0, z0) + Fy(x0, y0, z0)y(x0) + Fz(x0, y0, z0)z(x0).
Usando questa condizione, si potrebbe provare il teorema seguente:
Teorema 177 Sia r0= (x0, y0, z0)punto di estremo della funzione F(x, y, z)vincolato alla
curva
γ:g1(x, y, z) = c , g2(x, y, z) = d .
Valga inoltre la condizione (5.14) . In tal caso esistono due numeri λ1eλ2tali che il punto
r0= (x0, y0, z0)`e punto estremale libero della funzione
F(x, y, z) + λ1g1(x, y, z) + λ2g2(x, y, z).
Ossia, nel punto (x0, y0, z0)valgono contemporaneamente le condizioni seguenti:
g1(x0, y0, z0) = c ,
g2(x0, y0, z0) = d ,
Fx(x0, y0, z0) + λ1g1,x(x0, y0, z0) + λ2g2,x(x0, y0, z0) = 0 ,
Fy(x0, y0, z0) + λ1g1,y(x0, y0, z0) + λ2g2,y(x0, y0, z0) = 0 ,
Fz(x0, y0, z0) + λ1g1,z(x0, y0, z0) + λ2g2,z(x0, y0, z0) = 0 .
La coppia (λ1, λ2) si chiama ancora moltiplicatore di Lagrange (vettoriale) ed i due numeri
si chiamano moltiplicatori di Lagrange .
174 CAPITOLO 5. FUNZIONI IMPLICITE ED ESTREMI VINCOLATI
5.5.4 Osservazione importante
Il metodo dei moltiplicatori di Lagrange d`a condizioni necessarie che devono essere sod-
disfatte da un punto di estremo vincolato, senza necessit`a di esplicitare preventivamente
l’equazione del vincolo. In ciascuno dei tre casi esaminati, le condizioni possono scriversi
come segue: si introduce la funzione
L(r) = F(r) + λ·g(r).
Nei primi due casi esaminati, λ`e un numero e g(r) `e una funzione a valori reali; nell’ultimo
caso λ`e un vettore a due dimensioni, g(r) = g1(r)g2(r)e il punto indica il prodotto
scalare.
In tutti i casi la ricerca del minimo o massimo vincolato di F(r) si riconduce alla ricerca
dei punti estremali di L(r). L’osservazione importante `e questa: in generale gli estremi
vincolati di F(r) sono solamente punti estremali di L(r). Non sono n`e punti di massimo e
punti di minimo di L(r).
La funzione L(r) sopra introdotta si chiama lagrangiana del problema (di minimo,
oppure di massimo).
5.6 Appendice: la dimostrazione del teorema 165
La dimostrazione come conseguenza del Teorema della funzione implicita.
Come si `e detto, consideriamo il caso n= 2.
Scriviamo in componenti la relazione
x= (x, y) = F(r) = φ(u, v)
ψ(u, v),r= (u, v).
Ossia scriviamo quest’uguaglianza come
x=φ(u, v), y =ψ(u, v).(5.15)
Vogliamo considerare questa come un sistema di equazioni nelle incognite (u, v). Per ipotesi
si sa che
φ(u0, v0) = x0, ψ(u0, v0) = y0.
Si sa inoltre che φ(x, y) e ψ(x, y) sono di classe C1e che
JF(r0) = φu(u0, v0)ψv(u0, v0)φv(u0, v0)ψu(u0, v0)6= 0 .(5.16)
Consideriamo la prima equazione in (5.15), che scriviamo come
0 = f(u, v, x) = φ(u, v)x . (5.17)
La (5.16) mostra che fu(u0, v0, x0) = φu(u0, v0)6= 0 oppure fv(u0, v0, x0) = φv(u0, v0)6=
0. Sia per esempio
φu(u0, v0) = fu(u0, v0, x0)6= 0 .
5.6. APPENDICE: LA DIMOSTRAZIONE DEL TEOREMA ?? 175
In tal caso si pu`o risolvere l’equazione (5.17) rispetto alla variabile uottenendo, in un
opportuno aperto Wcontenente (u0, v0, x0),
u=U(v, x), U(v0, x0) = u0, φ(U(v, x), v) = x ,
Uv(v0, x0) = fv(u0, v0, x0)
fu(u0, v0, x0
=φv(u0, v0)
φu(u0, v0).(5.18)
Quando (u, v, x)Wallora si ha (v, x)H, aperto contenente (v0, x0) ed uappartiene ad
un intorno di u0.
Consideriamo ora l’equazione seguente, nell’aperto H×R:
0 = g(v, x, y) = ψ(U(v, x), v)y .
Quest’uguaglianza `e soddisfatta nel punto (v0, x0, y0). Mostreremo in seguito che gv(v0, x0, y0)6=
0. Accettando ci`o, il teorema della funzione implicita mostra che l’equazione si pu`o risolvere
rispetto a v, ottenendo una funzione V(x, y) di classe C1
v=V(x, y).
Questa uguaglianza vale per (v, x, y) in un opportuno aperto Kcontenente (v0, x0, y0) e la
funzione V(x, y) `e di classe C1.
Sostituendo v=V(x, y) nell’uguaglianza u=U(v, x) (si veda la (5.18)) si ottiene la
soluzione del sistema (5.15)
u=U(V(x, y), x), v =V(x, y)
e, ricordiamo, le funzioni U(x, y) e V(x, y) sono di classe C1.
Vediamo ora quali restrizioni sono state imposte ai punti (u, v) ed (x, y). Questi sono
rappresentati dalle condizioni
(u, v, x)W , (v, x, y)H×R,(v, x, y)K .
Si identifica cos`ı un aperto di R4, contenente il punto (u0, v0, x0, y0). L’aperto Adetto nel
teorema `e la proiezione di quest’aperto sul piano (u, v) mentre l’aperto B`e la proiezione sul
piano (x, y).
Per completare la dimostrazione, proviamo che gv(v0, x0, y0)6= 0. Usando l’espressione
di Uv(v0, x0) in (5.18) si trova
gv(v0, x0, y0) = ψu(U(v0, x0), v0)Uv(v0, x0) + ψv(U(v0, x0), v0)
ψu(u0, v0)φv(u0, v0)
φu(u0, v0)+ψv(u0, v0)
=1
φu(u0, v0)[φu(u0, v0)ψv(u0, v0)φv(u0, v0)ψu(u0, v0)]
=1
φu(u0, v0)JF(r0)6= 0 .
176 CAPITOLO 5. FUNZIONI IMPLICITE ED ESTREMI VINCOLATI
Capitolo 6
Curve e superfici
Le curve e le superfici in forma implicita sono gi`a state incontrate. In questo capitolo
studiamo le propriet`a delle curve e delle superfici definite parametricamente. Saremo precisi
nella definizione di curva mentre le “superfici” verranno definite in modo meno formale e
preciso.
6.1 Curve parametriche
Conviene procedere per gradi nella definizione di curva. Una prima definizione, che verr`a
resa pi`u precisa in seguito, `e la seguente: Una trasformazione continua da un intervallo Iin
Rnsi chiama curva parametrica .
Nella definizione di curva l’intervallo pu`o essere chiuso o meno, limitato o meno. Se per`o
l’intervallo `e chiuso e limitato la curva si chiama un arco .
Una curva a valori in R3si rappresenta in coordinate cartesiane nella forma
r(t) = x(t)i+y(t)j+z(t)ktI .
La curva si dice piana quando la sua immagine appartiene ad un piano di R3, ossia
quando esistono numeri a,b,c,d,indipendenti da t,tali che per ogni valore di tvalga
ax(t) + by(t) + cz(t) = d .
Quando la curva `e piana ed appartiene al piano z= 0 essa si rappresenta semplicemente
come
r(t) = x(t)i+y(t)j.
Notazione analoga quando la curva appartiene agli altri piani coordinati.
Una curva si indica con una lettera greca minuscola:
γ:tr(t)tI .
In seguito noi ci limiteremo a considerare curve che hanno le seguenti propriet`a di
regolarit`a: la funzione tr(t) `e derivabile su (a, b) con l’eccezione di un numero finito
177
178 CAPITOLO 6. CURVE E SUPERFICI
di punti ti. Si richiede che in questi punti (ed anche in ae in bse l’intervallo `e limitato)
esistano i limiti direzionali di r(t). Inoltre si richiede che per t6=tisi abbia r(t)6= 0. Una
curva con tali propriet`a si chiama regolare a tratti e si parla di curva regolare quando
essa `e ovunque derivabile, con r(t)6= 0 per ogni t.
Sia γuna curva regolare e sia r0=r(t0) un punto della sua immagine. Una almeno
delle componenti di r(t), per esempio la prima componente x(t), `e invertibile in un intorno
di t0. Dunque l’immagine della restrizione di r(t) a tale intorno `e anche immagine di una
funzione di x. Si osservi che questo non implica che l’immagine di r(t) debba essere grafico
di funzione, perch´e niente possiamo dire nei punti di t“lontani” da t0. Questo `e illustrato
dalla figura 6.1, a sinistra, che riporta l’immagine, diciamo γ, della funzione
(sin t)i+t(π2t2)j, t [π, π].(6.1)
Si vede che quest’immagine non `e grafico di funzione in nessun intorno di (0,0) nonostante
che la funzione x= sin tsia invertibile. La sua inversa `e
t= arc sin x(6.2)
e quindi la relazione tra xed y`e la funzione
y= [arc sin x]nπ2[arc sin x]2o.
Il suo grafico `e la parte spessa dell’immagine. Non esaurisce tutta la γperch´e i valori di t
ottenuti da (6.2) sono solamente quelli dell’intervallo [π/2, π/2].
E’ appena il caso di notare che una curva, oltre che in coordinate cartesiane, pu`o
rappresentarsi, per esempio, in coordinate polari.
Esempio 178 La curva
x=tcos t , y =tsin t , t > 0 (6.3)
rappresenta una spirale, si veda la figura 6.1 a destra.
Essa pu`o anche rappresentarsi in coordinate polari, come
θ=t , ρ =t , t > 0.
Consideriamo una curva piana. Questa si chiama curva cartesiana se `e rappresentata
mediante una parametrizzazione della forma
tti+y(t)j
oppure
tx(t)i+tj.
Pi`u in generale, se tr(t) `e una curva in Rn, si dice che questa `e una curva cartesiana
quando una delle componenti della funzione r(t) ha la rappresentazione xi(t) = t.
Un arco si dice chiuso quando una sua parametrizzazione r(t), t[a, b] verifica r(a) =
r(b).
Una curva, oppure un arco, si dice semplice quando r(t) = r(t′′) vale solamente per
t=t′′ oppure se t=a,t′′ =b.
6.1. CURVE PARAMETRICHE 179
Figura 6.1: Le curve (6.1) e (6.3)
−1 −0.8 −0.6 −0.4 −0.2 0 0.2 0.4 0.6 0.8 1
−15
−10
−5
0
5
10
15
γ
x
y
−10 −8 −6 −4 −2 0 2 4 6 8
−6
−4
−2
0
2
4
6
8
L’interpretrazione fisica del concetto di curva parametrica `e suggerita dai problemi della
meccanica: il parametro trappresenta il tempo ed il punto r(t) rappresenta la posizione
all’istante tdi un punto massa mobile nel tempo. Quest’interpretazione spiega la condizione
di continuit`a posta nella definizione di curva (un punto massa non fa salti). La funzione
tr(t) si chiama in fisica la legge del moto e il vettore r(t) rappresenta la velocit`a
del punto all’istante t. Si noti che la velocit`a pu`o essere discontinua, per esempio quando si
verificano urti.
Introduciamo ora il “verso di percorrenza” su una curva parametrica semplice: Il pa-
rametro tdi una curva appartiene ad un intervallo (a, b) di ReR`e un insieme ordinato.
Dunque possiamo introdurre un ordine su una curva semplice γdi parametrizzazione r(t)
dicendo che il punto r(t) viene prima del punto r(t′′) quando t< t′′; ossia quando un punto
mobile sulla curva traversa prima r(t) e poi r(t′′). Si dice anche che, in tal caso, il punto
r(t)precede r(t′′).
Nel caso che la curva sia semplice e chiusa, il punto r(a) coincide col punto r(b) e quindi
sfugge alla definizione data di ordine.
Osservazione 179 La definizione di curva parametrica `e una definizione soddisfacente per
alcune applicazioni della fisica, ma non per tutte, ed `e del tutto insoddisfacente per la
geometria. Infatti, privilegia un modo di misurare il trascorrere del tempo. Ora, due orologi
diversi possono segnare ore diverse perch´e sono stati azzerati in istanti diversi e anche perch´e
uno va pi`u velocemente dell’altro. Quindi il medesimo moto viene ad avere rappresentazioni
diverse, a seconda dell’orologio che si usa per descriverlo. Dobbiamo quindi migliorare la
definizione di curva, tenendo conto di ci`o. Osservare una propriet`a cruciale del tempo: il
tempo non si ferma e va in una sola direzione. Questo vuol dire che se indico con τil tempo
segnato da un orologio, al medesimo istante un secondo orologio segner`a un diverso numero,
diciamo t. La corrispondenza che a τfa corrispondere t`e continua (perch´e il tempo non
fa salti) e monotona strettamente crescente (perch´e il tempo non si ferma e va in una sola
direzione).
Quest’osservazione `e la chiave per capire la definizione generale di curva che daremo al
prossimo paragrafo.
180 CAPITOLO 6. CURVE E SUPERFICI
6.1.1 I cambiamenti di parametro e la definizione di
curva
Vogliamo ora completare la definizione di curva, tenendo conto delle ragioni esposte nell’os-
servazione 179.
Si dice che si cambia parametrizzazione della curva γquando si opera la sostituzione
t=t(τ) purch´e la funzione τt(τ) sia continua e strettamente crescente da un intervallo
Jsull’intervallo I. In pratica noi assumeremo anche che questa trasformazione sia derivabile
(e quindi che sia t(τ)0). Talvolta baster`a supporre che la trasformazione sia derivabile a
tratti.
Rendendo pi`u precisa la definizione di curva, si dice che r(t), tIe˜
r(τ), τJsono due
diverse parametrizzazioni della stessa curva quando ˜
r(τ) = r(t(τ)) con la funzione τt(τ)
strettamente crescente e suriettiva.1
Questa definizione corrisponde al concetto fisicamente intuitivo che una stessa “curva”
pu`o descriversi con leggi orarie diverse.
Sia ora
γ:tr(t), t (a, b)
e si consideri la trasformazione
tb+at , t (a, b).
Questa trasformazione `e monotona decrescente e quindi la curva di parametrizzazione
tr(bat), t (a, b)
`e diversa dalla γ. Intuitivamente, la seconda curva si ottiene “percorrendo la γall’indietro”.
Quando si effettua questa trasformazione sul parametro della curva, si dice che “si `e cambiato
il verso di percorrenza della curva e la curva cos`ı ottenuta a partire dalla γsi indica col
simbolo
γ . (6.4)
Ora, alcune propriet`a che dovremo studiare cambieranno al cambiare della parametriz-
zazione, ossia della legge del moto. Altre non dipenderanno dalla parametrizzazione. Le
considereremo propriet`a “geometriche” della curva. Vediamo alcuni casi:
Teorema 180 Parametrizzazioni diverse della medesima curva hanno la stessa immagine.
L’immagine comune a tutte le parametrizzazioni di una curva γsi chiama il sostegno di γ.
Dunque il sostegno `e una propriet`a geometrica della curva. Lo stesso dicasi della propriet`a
di essere curva chiusa o curva semplice:
1in modo pi`u rigoroso: si introduce una relazione di equivalenza tra due curve definite
parametricamente r(t)tIe˜r(τ), τJ: esse sono equivalenti quando esiste una trasfor-
mazione continua e strettamente crescente t(τ) da Jsu Itale che r(t(τ)) = ˜r(τ) per ogni
τ(α, β). E quindi si definisce curva una classe di equivalenza rispetto a tale relazione.
Per provare che quella introdotta `e effettivamente una relazione di equivalenza va ricordato
che la funzione inversa di una funzione crescente `e essa stessa crescente.
6.1. CURVE PARAMETRICHE 181
Teorema 181 Siano IeJdue intervalli e siano r(t),tI,˜r(τ)due curve parametriche.
Sia t(τ)una trasformazione strettamente monotona da Jin I, suriettiva, tale che
˜r(τ) = r(t(τ)) .
Allora, la curva parametrica r(t)`e chiusa se e solo se la curva parametrica ˜r(τ)lo `e; r(t)`e
semplice se e solo se ˜r(τ)lo `e.
Ossia, le propriet`a di essere chiusa, o di essere semplice, non dipendono dalla particolare
rappresentazione parametrica di una curva ma solo dalla curva stessa: sono quindi propriet`a
geometriche della curva.
E’ importante notare che le propriet`a appena dette non cambiano nemmeno cambiando
il senso di percorrenza della curva. Ossia:
La curva γe la curva γhanno il medesimo sostegno. L’una `e
semplice
chiusa
semplice e chiusa
se e solo se l’altra lo `e.
Inoltre,
Teorema 182 l’ordine sulla curva non muta cambiando parametrizzazione.
E’ proprio per ottenere ci`o che si `e imposto che i cambiamenti di parametro debbano essere
strettamente crescenti.
L’ordine su γ`e invece l’opposto di quello su γ.
Quando la trasformazione t(τ) da un intervallo Jsu un intervallo I`e continua e stret-
tamente monotona (crescente o meno) allora I`e sia limitato che chiuso se e solo se Jlo `e.
Dunque diremo che una curva `e un arco quando una sua parametrizzazione `e definita su
un intervallo limitato e chiuso: la propriet`a di essere un arco `e una propriet`a geometrica della
curva e non cambia cambiando verso di percorrenza sulla curva, ossia essa `e comune sia a γche
aγ.
invece, dipendono dalla parametrizzazione sia la velocit`a r(t)che la propriet`a di essere una
curva cartesiana.
Si consideri ora l’esempio seguente:
Esempio 183 le due curve
t(cos t)i+ (sin t)j, t (0,2π] e t(cos t)i+ (sin t)j, t (0,4π)
hanno il medesimo sostegno (la circonferenza x2+y2= 1).
Le due parametrizzazioni per`o non possono ricondursi l’una all’altra mediante un cam-
biamento di parametro (che deve essere strettamente crescente) perch´e la prima curva `e
semplice e l’altra non lo `e.
182 CAPITOLO 6. CURVE E SUPERFICI
Gli archi semplici2hanno molte propriet`a importanti. Tra queste:
Teorema 184 Sia
γ:tr(t), t (a, b)
un arco semplice (chiuso o meno). Esiste soltanto un diverso arco che ha il medesimo
sostegno, e questo `e l’arco γ.
Grazie a questo risultato, trattando di archi semplici, possiamo usare un linguaggio pi`u
informale: se si sa che un insieme S`e sostegno di un’arco semplice, possiamo parlare di
“arco S intendendo uno dei due archi che hanno Sper sostegno. In generale si intende
anche di aver fissato un verso di percorrenza su S, e in tal caso si sceglie quello dei due archi
che corrisponde a tale verso. Per esempio, sia
S={(x, y, z)|x2+y2+z2= 1 , x +y+z= 0}.
L’insieme S`e una circonferenza nello spazio. Possiamo parlare dell’“arco S intendendo
implicitamente di considerare Scome sostegno di un arco semplice e di scegliere una qualsiasi
delle parametrizzazioni che corrispondono a tale arco.
Se si stabilisce un verso di percorrenza su S, si viene a scegliere uno solo dei due archi
che hanno Sper sostegno. Si noti per`o che in generale non esiste un modo unico per la scelta
del verso di percorrenza e quindi questo linguaggio informale non identifica univocamente
l’arco. Vedremo che questa difficolt`a si risolve nel caso delle curve semplici e chiuse.
6.1.2 Lunghezza di un arco
Studiamo il problema di definire un numero che rappresenti la “lunghezza” di un arco in
Rn. Consideriamo per questo un arco (che indichiamo col simbolo γ) di parametrizzazione
tr(t), t[a, b]. Si sa che la tangente al grafico della funzione tr(t) nel punto (t0,r(t0))
ha equazione
r=r(t0) + r(t0)(tt0).
Dividiamo l’intervallo [a, b] mediante i punti tn, equidistanti, t0=a,. . . ,tN=be approssi-
miamo l’arco con tanti segmenti di tangente, si veda la figura 6.2: l’arco r(t), t[ti, ti+1]
si approssima mediante il segmento di tangente
r(t0) + r(t0)(tt0), t [ti, ti+1].
Sommiamo le lunghezze dei singoli segmenti di tangente. Ripetendo questo procedimen-
to per ogni Nsi costruisce una successione di numeri (LN).
Se esiste L= lim LN, si sceglie questo numero Lcome “lunghezza” dell’arco γ.
Pi`u precisamente, supponiamo che la funzione r(t) sia di classe C1e supponiamo che
essa ammetta le derivate direzionali finite in ambedue gli estremi aeb. Per definire la
lunghezza del’arco, si divide l’intervallo [a, b] in Nparti uguali mediante i punti kT
N, 0
k < N eT=ba. Il segmento di tangente al grafico nel punto ( kT
N,r(kT
N)) ottenuto per
t(kT
N,(k+1)T
N) ha lunghezza
rkT
N·T
N.
2si ricordi che ogni curva chiusa `e un arco.
6.1. CURVE PARAMETRICHE 183
Figura 6.2: La definizione di lunghezza: una curva e i suoi vettori
approssimanti
−3.5 −3 −2.5 −2 −1.5 −1 −0.5 0 0.5 1
−0.2
0
0.2
0.4
0.6
0.8
1
1.2
La lunghezza totale dei segmenti di tangente `e il numero
LN=
N1
X
k=0
rkT
N·T
N.
Se esiste, il numero L= lim LN`e l’integrale della funzione ||r(t)|| sull’intervallo [a, b].
Dunque, definiamo la lunghezza dell’arco ponendo
Lγ=Zb
a||r(t)|| dt . (6.5)
Osservazione 185 Al numero Lsiamo giunti scegliendo di dividere l’intervallo [a, b] in
parti uguali. Non `e difficile mostrare che allo stesso numero Lsi perviene considerando una
qualsiasi partizione di [a, b], la cui finezza tende a zero. Ci si pu`o chiedere per`o a quale
numero si giunge se, invece di “approssimare” il grafico con segmenti di tangente, si sceglie
di approssimarlo con segmenti di secante. E’ possibile provare che si giunge al medesimo
numero L, dato da (6.5).
Teorema 186 La lunghezza di un arco non muta cambiando parametrizzazione.
Dim.Sia t=t(τ) una trasformazione crescente da [α, β] su [a, b]. Sia inoltre essa ovunque
derivabile cos`ı che t(τ)0. Sia ˜
r(τ) = r(t(τ)).
La regola di cambiamento di variabile mostra che
L=Zb
a
d
dtr(t)
dt=Zβ
α
d
dtr(t(τ))
t(τ) dτ
=Zβ
α
d
dtr(t(τ))t(τ)
dτ=Zβ
α
d
dτ˜
r(τ)
dτ .
Dunque, il numero che esprime la lunghezza di un arco `e una propriet`a geometrica dell‘arco.
Vale inoltre:
184 CAPITOLO 6. CURVE E SUPERFICI
Teorema 187 La lunghezza di un arco non muta cambiando il verso di percorrenza sulla
curva. Ossia:
Lγ=Lγ.
Dim.Infatti, se t(τ)<0 allora
Zb
a
d
dtr(t)
dt=Zα
β
d
dtr(t(τ))
t(τ) dτ=Zβ
α
d
dtr(t(τ))
(t(τ))dτ
et(τ) = |t(τ)|. Dunque anche in questo caso vale
L=Zβ
α
d
dtr(t(τ))t(τ)
dτ=Zβ
α
d
dτ˜
r(τ)
dτ .
Osservazione 188
Un’interpretazione della formula (6.5) `e la seguente: la parame-
trizzazione tr(t) si intende come legge del moto di un punto che percorre la curva.
Allora, r(t) `e il vettore velocit`a del punto mobile all’istante t. La (6.5) si interpreta
dicendo che l’integrale del modulo della velocit`a d`a la lunghezza del cammino percorso.
Sia γuna curva cartesiana, ossia
γ:r(t) = ti+f(t)j.
In questo caso,
r(t) = i+f(t)j,|r(t)|=p1 + [f(t)]2.(6.6)
La lunghezza dell’arco ottenuto quando t[a, b] `e quindi data da
Lγ=Zb
ap1 + [f(t)]2dt .
Definiamo ora la funzione s(t)
s(t) = Zt
a||r(ν)|| dν t [a, b].
Se l’arco γ`e regolare, s(t)>0 per ogni t. Ossia la trasformazione ts(t) da [a, b] su [0, L]
`e un cambiamento di parametro per l’arco γ. Il numero s[0, L] si chiama per questo il
parametro d’arco . Se come parametro di γsi sceglie ssi trova una nuova parametrizzazione
dell’arco γ, che indichiamo con r(s) e che si chiama la parametrizzazione canonica dell’arco.
La sua propriet`a importante `e che
d
dsr(s)
= 1 .
Infatti, essendo s(ν) la funzione inversa di ν(s), si ha:
d
dsr(s) = d
dsr(ν(s)) = d
dνr(ν(s))ν(s)
=d
dνr(ν(s))1
s(ν(s)) =d
dνr(ν(s))1
k( d/dν)r(ν(s))k.
6.1. CURVE PARAMETRICHE 185
Dunque, quando la curva `e data mediante la sua parametrizzazione canonica, la formula per
la lunghezza si riduce a:
L=ZL
0
1 ds .
Il parametro d’arco si presta allo studio delle propriet`a geometriche delle curve. Per`o la
parametrizzazione mediante il parametro d’arco `e spesso piuttosto complicata e spesso non
si presta a fare calcoli concreti.
Concludiamo dicendo che in fisica la funzione s=s(t) si chiama legge oraria del moto.
6.1.3 Propriet`a differenziali delle curve piane e dello
spazio
Studiamo prima di tutto il caso delle curve piane.
Supponiamo che l’arco γsia parametrizzata dalla sua lunghezza,
γ:sr(s), s [0, L]
e supponiamo che sia regolare a tratti; ossia che la funzione sr(s) sia ovunque continua;
inoltre supponiamo che essa sia derivabile, con kr(s)k 6= 0 su [0, L], con la possibile eccezione
di un numero finito di valori s1,. . . ,skdi s.
In tali punti richiediamo che esistano finiti3i limiti direzionali i limiti direzionali di r(s).
Il versore
t(s) = d
dsr(s)
applicato nel punto r(s) si chiama il versore tangente alla curva nel punto r(s). Il versore
tangente `e definito salvo che in un numero finito di valori di s.
Per ogni snel quale t(s) `e definito, introduciamo il versore n(s) ortogonale a t(s) e
diretto in modo tale che la coppia (t(s),n(s)) sia orientata positivamente (ossia, possa
sovrapporsi ordinatamente ai versori iejdegli assi coordinati mediante una rotazione e una
traslazione di assi). Il versore n(s) si chiama il versore normale alla curva γ.
Vale:
Teorema 189 Sia γuna curva regolare, la cui parametrizzazione `e di classe C2. Allora il
vettore n(s)`e derivabile e in ogni punto `e colineare col vettore t(s).
Dim. Infatti, ||t(s)|| = 1 per tutti gli se quindi t(s)·t(s) = 0 per ogni s. Dunque,
n(s) = ±t(s)
||t(s)|| . Ci`o mostra che per ogni valore di si due vettori t(s) ed n(s) sono
colineari.
Fissiamo ora un valore s0in cui r(s) ammette derivata continua e supponiamo4che sia
n(s0) = + t(s0)
||t(s0)|| . Ci`o vuol dire che
det ht(s0) + t(s0)
||t(s0)|| i>0.
3ossia, richiediamo che esistano anche i limiti direzionali di kr(s)ke che questi siano
finiti.
4considerazioni analoghe se n(s0) = t(s0)
||t(s0)|| .
186 CAPITOLO 6. CURVE E SUPERFICI
Per continuit`a, la disuguaglianza si conserva in un intorno di s0e ci`o mostra che in un
intorno di s0vale
n(s) = + t(s)
||t(s)|| .
Il denominatore non si annulla e quindi n(s) `e derivabile.
Osservazione 190 Si ricordi che la derivata del versore t(s) `e il limite del rapporto incre-
mentale t(s+h)t(s)
h,
applicato in r(s).
Supponiamo ora di lavorare con parametrizzazioni di classe C2di curve regolari, e
studiamo t(s).
Si `e visto nella dimostrazione del Teorema 189, che t(s) `e parallelo al versore n(s).
Esiste quindi un numero k(s) tale che
t(s) = k(s)n(s).(6.7)
Il numero k(s), che pu`o essere positivo o negativo, si chiama la curvatura di γnel
punto r(s). Prendendo la norma dei vettori ai due membri di (6.7) si trova
|k(s)|=||t(s)||.
L’esempio seguente mostra che la curvatura pu`o cambiare segno da punto a punto di
una medesima curva; e mostra anche che per calcolare tangenti, normali e curvatura non `e
necessario parametrizzare preventivamente la curva col parametro d’arco.
Esempio 191 Sia r(x) = (x, f(x)) cos`ı che
ds(x)
dx=p1 + f2(x).
Dalla formula per la derivata della funzione inversa
t(s) = dr(s)
ds=dr(x(s))
dxx(s) = 1
p1 + f2(s)
d
dx(1
p1 + f2(x)(1, f(x))).
Dunque,
dt(x)
ds=1
p1 + f2(x)
d
dx"(1, f(x))
p1 + f2(x)#
1
p1 + f2(x)
1
1 + f2(x)"(0, f′′(x))p1 + f2(x)(1, f(x)) f(x)f′′(x)
p1 + f2(x)#
=f′′(x)
(1 + f2(x))2(f(x),1) = k(x)1
p1 + f2(x)(f(x),1) .
6.1. CURVE PARAMETRICHE 187
Figura 6.3: Versore tangente e versore normale
−3.5 −3 −2.5 −2 −1.5 −1 −0.5 0 0.5 1
−0.2
0
0.2
0.4
0.6
0.8
1
1.2
t
n
−3.5 −3 −2.5 −2 −1.5 −1 −0.5 0 0.5 1
−0.2
0
0.2
0.4
0.6
0.8
1
1.2
t
n
Si trova da qui
k(x) = f′′(x)
(1 + f2(x))3/2.
La curvatura ha quindi il segno di f′′(x).
Si confronti con la definizione di curvatura data al par. 6.3 del testo di Analisi Mate-
matica 1.
Osserviamo ora che t(s)·n(s) = 0 e quindi, derivando,
0 = t(s)·n(s) + t(s)·n(s) = k(s)n(s)·n(s) + t(s)·n(s) = k(s) + t(s)·n(s).(6.8)
D’altra parte, n(s) `e ortogonale ad n(s) (perch´e ||n(s)|| = 1) e quindi
n(s) = α(s)t(s).
Sostituendo nella (6.8) si vede che α(s) = k(s). Ne viene che le due funzioni t(s) ed n(s)
risolvono il sistema di equazioni differenziali
t(s) = k(s)n(s),n(s) = k(s)t(s).(6.9)
Queste equazioni si chiamano Equazioni di Frenet per le curve piane.
Il sistema di riferimento dato dai due versori t(s), n(s) (in quest’ordine) applicati nel
punto r(s) si chiama il riferimento mobile sulla curva. La figura 6.3 illustra il riferimento
mobile nel caso in cui la curva venga percorsa in due versi opposti.
Studiamo ora il caso delle curve di R3. Intendiamo ancora che la curva sia parametriz-
zata dal parametro d’arco.
La definizione del versore tangente t(s) `e ancora
t(s) = d
dsr(s).
Invece, la curvatura deve essere trattata in modo diverso. Assegnato il vettore t(s) tan-
gente alla curva γe di modulo 1, `e ancora vero che t(s) `e ortogonale a t(s). Dunque
188 CAPITOLO 6. CURVE E SUPERFICI
Figura 6.4: Le regioni interna ed esterna e la normale esterna
Regione interna
Regione
esterna
privilegeremo, tra le infinite direzioni normali a t(s), la direzione di t(s); ma non c’`e alcun
modo di privilegiare un verso su tale direzione. Dunque decidiamo di scegliere come versore
normale il versore
n(s) = t(s)
||t(s)|| .(6.10)
Chiamiamo questo il versore normale alla curva γ. Chiamiamo curvatura il numero k(s)
tale che
t(s) = k(s)n(s) ossia k(s) = ||t(s)|| =t(s)·n(s).
In questo modo,
k(s)0s .
Osservazione 192 Se una curva regolare `e piana, il suo versore normale `e ovunque defi-
nito. Invece, una curva nello spazio potrebbe essere priva di versore normale su tutto un
arco o addirittura ovunque. Ci`o avviene se t(s) `e nullo. In particolare, pu`o accadere che
t(s) sia identicamente zero su un intervallo. In questo caso, l’arco corrispondente `e piano,
parametrizzato da
r(s) = sr0+r1.
La definizione di versore normale data in R3non si applica in questo caso.
6.2 Curve piane
E’ importante sapere che vale il teorema seguente, di enunciato del tutto intuitivo ma di
dimostrazione molto complessa:
Teorema 193 (teorema di Jordan ) Sia γuna curva piana chiusa e semplice. Il com-
plementare del sostegno di γ`e unione di due regioni. Una di esse `e illimitata (e si dice
esterna alla curva) mentre l’altra `e limitata e si dice la regione interna alla curva.
Il teorema `e illustrato nella figura 6.4, a sinistra.
Il sostegno di γ`e la frontiera sia della regione interna che della regione esterna di γ(si
veda il paragrafo 3.3 per la definizione di frontiera).
6.2. CURVE PIANE 189
Figura 6.5: Regola d’Amp`ere per una curva piana
−0.1 −0.05 0 0.05 0.1 0.15 0.2 0.25 0.3
−0.1
−0.05
0
0.05
0.1
0.15
0.2
0.25
v
w
−0.1
0
0.1
0.2
0.3
0.4
−0.1
0
0.1
0.2
0.3
0.4
0
0.05
0.1
0.15
0.2
0.25
0.3
0.35
bf x
y
z
v
w
Esempio 194 La curva
x= 3 cos θ , y = 2 sin θ
ha per sostegno un’ellisse. La sua regione interna `e la parte di piano delimitata dall’ellisse.
La regione esterna `e quella dei punti che “stanno fuori” dall’ellisse.
Ovviamente, non esiste alcun “teorema di Jordan” per curve dello spazio!
Usa chiamare regione di Jordan la regione interna ad una curva piana semplice e chiusa.
Se γindica la curva, conviene indicare con γla sua regione interna. Vale:
Teorema 195 Sia γuna curva semplice e chiusa. E’:
γ= γ.
La regione interna ad una curva piana semplice e chiusa pu`o essere assai complicata;
ma nella maggior parte dei casi che si incontrano nelle applicazioni sar`a facile identificarla.
Nel paragrafo 6.1 abbiamo usato l’ordinamento su Rper definire un ordine sulla curva
γ. Nel par. 3.2.1 abbiamo notato che il piano pu`o venire orientato con la regola seguente: la
coppia dei vettori vewapplicati in Oe presi in quest’ordine, `e orientata positivamente quando
la semiretta identificata da vdeve ruotare in verso antiorario per portarsi su quellaidentificata
da w, percorrendo l’angolo minore possibile. Si veda la figura 6.5 a sinistra.
Questa definizione pu`o anche riformularsi mediante la regola d’ Amp`ere : una persona
stando in piedi nell’origine del piano xy con la testa nel verso positivo dell’asse delle quote vede la
semiretta muoversi in verso antiorario, e quindi la vede passare dalla sua destra alla sua sinistra.
Sia ora γuna curva piana semplice e chiusa. Ricordiamo che il suo sostegno `e sostegno,
oltre che di γ, soltanto della seconda curva γ, che si ottiene “andando all’indietro”. Di-
ciamo che γ`e orientata in modo concorde a R2,o anche che `e orientata positivamente ,
se vale la regola d’ Amp`ere: una persona in piedi in un punto della regione interna alla curva,
stando in piedi come l’asse delle quote positivo, vede un punto mobile sulla curva passare dalla
sua destra alla sua sinistra. In modo equivalente, si pu`o anche dire che un insetto che segue il
punto mobile su una curva semplice e chiusa vede la regione interna alla sua sinistra, si veda la
figura 6.5 a destra.
Altrimenti, diciamo che `e orientata negativamente. Vale:
190 CAPITOLO 6. CURVE E SUPERFICI
Teorema 196 Delle due curve semplici e chiuse, γeγ, una `e orientata positivamente e
l’altra `e oreintata negativamente.
Supponiamo ora che la curva piana semplice e chiusa γsia anche regolare, cos`ı che si
possono definire sia il vettore tangente t(s) che il vettore normale n(s). Il vettore normale
n(s) pu`o puntare sia verso la regione interna che verso la regione esterna alla curva. Per il
seguito avremo bisogno del vettore normale che punta verso la regione esterna alla curva γ
(si veda la figura 6.4, a destra). Lo indicheremo col simbolo
ne(s)
e lo chiameremo la normale esterna .
Osservazione 197 Al paragrafo 6.1.3 si `e definito il vettore n(s) come il vettore normale
at(s), orientato in modo tale che la coppia ordinata (t(s),n(s)) costituisca un sistema di
riferimento positivo. Dunque n(s) punta verso la sinistra di t(s). Quando la curva `e orientata
positivamente, allora n(s) punta verso la regione interna alla curva. Quindi, in questo caso
si ha n(s) = ne(s).
Torniamo ad usare il fatto che il sostegno di una curva semplice e chiusa `e sostegno
anche di una seconda curva, che si ottiene dalla prima “girando in verso opposto”. Que-
st’osservazione permette di introdurre un linguaggio pi`u informale, che tuttavia `e limitato
alle curve piane. Supponiamo che si sappia che un certo insieme del piano `e il sostegno
di una curva semplice e chiusa. Per esempio un quadrato o una circonferenza. Invece di
scrivere esplicitamente la parametrizzazione della curva, possiamo indicare il sostegno e implici-
tamente intendere di scegliere quella curva semplice che ha il sostegno dato e che `e orientata
positivamente, senza dover esplicitamente scrivere una sua parametrizzazione. In particolare,
se `e la regione interna ad una curva semplice e chiusa γ, e se vogliamo che γsia orientata
positivamente, potremo semplicemente indicarla come “frontiera di Ω”, Ω.
Osservazione 198 Con questa convenzione, se γ`e un sostegno di curva semplice e chiusa,
si indica con γ(o, per ridondanza, +γ) la curva semplice e chiusa che ha il dato sostegno
e che `e orientata positivamente, e con γquella che ha il dato sostegno ed `e orientata
negativamente.
6.3 Le superfici
Studiamo ora le superfici in R3. Considerazioni analoghe a quello che hanno condotto a defi-
nire prima le curve parametriche e poi le curve come “oggetti geometrici” si possono ripetere
per le superfici. Per`o sono alquanto complesse e quindi ci limiteremo a definire le superfici
parametriche, mostrando quando certe propriet`a che ci interessano sono indipendenti dalla
parametrizzazione scelta.
6.3.1 Superfici definite parametricamente
Nel definire le curve `e stato naturale partire da funzioni continue definite su intervalli. Per
definire le superfici dobbiamo considerare funzioni continue di due variabili, definite quindi
6.3. LE SUPERFICI 191
su un dominio contenuto in R2.richiederemo che il dominio sia una regione. Una funzione
continua
r(u, v) = x(u, v)i+y(u, v)j+z(u, v)k(6.11)
il cui dominio `e una regione di si chiama una superficie definita parametricamente.
L’immagine della funzione r(u, v) si chiama il sostegno della superficie mentre il punto
(u, v) variabile in si chiama il parametro della superficie.
Una superficie si dice semplice quando valori diversi del parametro hanno per immagine
punti diversi del sostegno.
Una superficie si dice chiusa quando il suo sostegno `e la frontiera di una regione di
R3.
Sia
Σ : (u, v)x(u, v)i+y(u, v)j+z(u, v)k
una superficie. Diremo che la superficie `e regolare quando la trasformazione (6.11) `e di
classe C1e inoltre la matrice jacobiana della trasformazione
xu(u, v)xv(u, v)
yu(u, v)yv(u, v)
zu(u, v)zv(u, v)
(6.12)
ha rango 2, ossia il massimo possibile, in ogni punto della regione Ω.
Cos`ı come nel caso delle curve, una stessa superficie pu`o parametrizzarsi in pi`u modi.
Senza entrare in eccessivi dettagli, diremo che una trasformazione
α
βu(α, β)
v(α, β)
`e un cambiamento di parametro quando `e definita su una regione ˜
Ω, a valori in Ω; `e iniettiva
e suriettiva; `e di classe C1e inoltre conserva l’orientazione di R2,ossia il suo jacobiano `e
positivo in ogni punto:
det uα(α, β)uβ(α, β)
vα(α, β)vβ(α, β)>0.
Si noti l’analogia con la nozione di cambiamento di parametro per una curva. Anche
nel caso delle curve il cambiamento di parametro deve conservare l’orientazione, in tal caso
l’orientazione di R.
E’ ovvio che cambiando parametro non si cambia il sostegno di una superficie.
Diremo equivalenti, e le identificheremo, due superfici che differiscono solamente per la
parametrizzazione.
Le funzioni definite su Ω, a valori in R3, sono particolari superfici, rappresentate da
Σ : (x, y)xi+yj+z(x, y)k.
Esse si chiamano superfici cartesiane . Il sostegno in questo caso `e il grafico della funzione
z(x, y).
Sia ora Γuna regione di Jordan e sia r(u, v) una funzione continua sull’insieme chiuso
costituito dall’unione della regione Γe del supporto di Γ. In tal caso la funzione r(u, v) si
chiama calotta . Ovviamente, la restrizione di r(u, v) ad Γ`e una superficie.
192 CAPITOLO 6. CURVE E SUPERFICI
Conviene estendere la definizione di calotta in questo modo. Siano date, oltre alla Γ,
anche le curve di Jordan γ1,γ2,. . . , γni cui sostegni non si intersecano. Supponiamo che
ciascuna di queste curve abbia sostegno in Γ. Indichiamo con Kl’insieme chiuso i cui
punti sono quelli del sostegno di Γ e della sua regione interna Γ, esclusi i punti della
regione interna a ciascuna γi(e quindi inclusi i punti dei sostegni delle γi). La figura 6.6
mostra in tratteggio un esempio di insieme K. Se la funzione r(u, v) in (6.11) `e continua
Figura 6.6: Insieme su cui si proietta una calotta
−4 −3 −2 −1 0 1 2 3 4
−4
−3
−2
−1
0
1
2
3
su Kessa si chiama calotta . Si chiama sostegno della calotta l’immagine della funzione
r(u, v).
L’insieme dei punti interni di K`e ancora una regione (anche se non pi`u una regione di
Jordan) e quindi la restrizione di r(u, v) a tale insieme `e una superficie.
Parleremo di calotta chiusa se accade che la calotta `e frontiera di un insieme aperto
di R3.
Osservazione 199 Non si confonda il concetto di “insieme chiuso” con quello di “superficie
chiusa” o di “calotta chiusa”. La calotta di parametrizzazione
x=u , y =v , z =u+v
definita sul disco u2+v21 ha per sostegno un insieme chiuso; ma la calotta stessa `e
contenuta nel piano z=x+ye quindi non `e una calotta chiusa.
Una superficie, oppure una calotta, si indica con una lettera greca maiuscola, come per
esempio Σ o Γ.
Il concetto seguente `e molto delicato e noi ci limitiamo a darne una definizione grosso-
lana. Supponiamo di avere una calotta Σ
r(u, v) = x(u, v)i+y(u, v)j+z(u, v)k,(u, v)K .
Supponiamo che la calotta sia semplice ossia che
x(u, v) = x(u, v), y(u, v) = y(u, v), z(u, v) = z(u, v)
6.3. LE SUPERFICI 193
possa aversi solo se u=uev=v. In tal caso si chiama bordo della calotta Σ l’immagine
della frontiera dell’insieme K; ossia l’immagine delle singole curve che delimitano l’insieme
K. La figura 6.7 mostra una calotta e il suo bordo.
Figura 6.7: Una calotta ed il suo bordo”
−6
−4
−2
0
2
4
6
0
0.5
1
1.5
2
2.5
3
3.5
4
0
5
10
15
20
Esempio 200 Si `e detto che la definizione di bordo `e insoddisfacente. Quest’esempio ne
mostra la ragione. Consideriamo la calotta definita come segue. La funzione r(θ, v) `e
Σ : x= cos θ , y = sin θ , z =v . (6.13)
Il dominio della funzione `e
0v1, ǫ θ2π
con ǫ > 0. Si tratta di un cilindro a cui `e stata tolta una striscetta, come in figura 6.8.
Questa calotta `e una calotta semplice e il suo bordo `e costituito dai due archi di circonferenza
(archi della circonferenza di sopra e di quella di sotto, alle quali `e tolto l’arco che corrisponde
a 0 < θ < ǫ) e dai bordi del taglio che le congiungono.
Supponiamo ora di mandare ǫa zero. In tal caso si trova un cilindro intero. La sua
parametrizzazione non `e pi`u semplice, e quindi non possiamo pi`u parlare di “bordo” secondo
la nostra definizione, anche se appare naturale considerare le due circonferenze come il bordo
del cilindro. Mentre il contributo dei due bordi del taglio “scompare”.
Quest’esempio mostra che dovremmo dare un modo per definire il bordo” anche per
calotte che non sono semplici. Per esempio anche nel caso del cilindro ottenuto scegliendo
θ[0,2π]. La soluzione ovvia `e quella di scegliere come bordo l’immagine della frontiera
dell’insieme K, in quest’esempio l’immagine del perimetro del rettangolo [0,1] ×[0,2π]. In
questo modo si otterrebbe come bordo l’insieme delle due circonferenze ed anche il segmento
verticale dei punti di coordinate (1,0, v), 0 v1. Questa soluzione per`o non `e accettabile.
Infatti lo stesso cilindro si parametrizza anche scegliendo come dominio della funzione (6.13)
l’insieme
0v1,πvπ
194 CAPITOLO 6. CURVE E SUPERFICI
Figura 6.8: Ancora una calotta col suo “bordo”
−1
−0.8
−0.6
−0.4
−0.2
0
0.2
0.4
0.6
0.8
1−1
−0.5
0
0.5
1
0
0.2
0.4
0.6
0.8
1
e con questa parametrizzazione si trova un’altro insieme come “bordo”: l’insieme costituito
dalle due circonferenze e dal segmento dei punti (1,0, v), 0 v1. Ossia, il bordo cos`ı
definito viene a dipendere dalla particolare parametrizzazione che si sceglie.
Ci sono vari modi per risolvere questa difficolt`a: uno, pi`u astratto, consiste nel conside-
rare tutte le parametrizzazioni della calotta, ciascuna definita su un proprio insieme K. Si
considerano quindi le immagini di tutte le frontiere di questi insiemi Ke se ne fa l’interse-
zione. Noi seguiremo una via “pi`u concreta” che si adatta ai casi semplici che incontreremo
nelle applicazioni e che sar`a illustrata al paragrafo 8.5.2.
6.3.2 Il piano tangente e la normale a una superficie
Sia
Σ : (u, v)x(u, v)i+y(u, v)j+z(u, v)k(u, v)
una superficie regolare e semplice. Fissiamo l’attenzione su un punto r0del sostegno. Dato
che la superficie `e semplice, questo proviene da un unico punto (u0, v0) del dominio:
u0= (u0, v0),r0=x(u0, v0)i+y(u0, v0)j+z(u0, v0)k.
Consideriamo ora il segmento per u0, parallelo all’asse delle ascisse, ossia la curva
γ:t(u0+t, v0)
Questo identifica una curva sulla superficie, parametrizzata da
tx(u0+t, v0)i+y(u0+t, v0)j+z(u0+t, v0)k.
La tangente a questa curva calcolata per t= 0, ossia in r0, `e identificata dal vettore v1
(applicato in r0)
v1=xu(u0, v0)i+yu(u0, v0)j+zu(u0, v0)k.(6.14)
Analogamente, considerando un segmento per u0parallelo all’asse delle ordinate, si trova
una curva sulla superficie, la cui tangente in r0`e identificata dal vettore v2(applicato in
r0):
v2=xv(u0, v0)i+yv(u0, v0)j+zv(u0, v0)k.(6.15)
6.3. LE SUPERFICI 195
Figura 6.9: Il piano tangente e la normale ad una superficie
4
2
0
-2
-4
-4
-2
0
2
10
30
40
50
0
20
4
N
−1
−0.5
0
0.5
1
−1
−0.5
0
0.5
1
−1
−0.5
0
0.5
1
v1
v2
n
In generale, il segmento
t(u0+at, v0+bt)
identifica una curva sulla superficie, il cui vettore tangente `e identificato dal vettore
av1+bv2(applicato in r0).
I vettori v1ev2dipendono da (u0, v0):
v1(u0, v0),v2(u0, v0)
e sono le due colonne della matrice jacobiana (6.12) e quindi sono linearmente indipendenti
(infatti abbiamo assunto che la superficie sia regolare). Dunque al variare di ae di bin R,
i vettori av1+bv2applicati in r0=r(u0, v0) descrivono un piano per r0, che si chiama il
piano tangente alla superficie nel punto r0.
Si noti esplicitamente che intendiamo di scegliere come sistema di riferimento cartesiano
(in generale, obliquo) in questo piano le rette identificate al vettore v1(u0, v0) per primo e
quindi v2(u0, v0). E su questi assi cartesiani si sceglie per verso positivo quello dei rispettivi
vettori. Dunque sul piano tangente `e definita un’orientazione.
Definiamo ora il vettore normale N(u0, v0) ponendo
N(u0, v0) = v1(u0, v0)v2(u0, v0).
Il vettore N(u0, v0) si intende applicato nel punto r0=r(u0, v0).
E’ ovvio:
Teorema 201 Se la superficie semplice Σ`e regolare, sia i vettori v1(u0, v0),v2(u0, v0)che
il vettore normale N(u0, v0)dipendono con continuit`a da (u0, v0).
Si ricordi che la superficie si `e supposta semplice. Quindi ogni r0proviene da un unico
punto (u0, v0)Ω. Dunque in ogni punto di una superficie regolare e semplice il vettore
normale Nsopra definito `e unico e questo vettore si potr`a considerare come funzione del
punto della superficie: N=N(r). Si `e cos`ı definito un campo vettoriale sulla superficie.
I concetti appena esposti sono illustrati nella figura 6.9.
Se la superficie `e cartesiana si ha:
196 CAPITOLO 6. CURVE E SUPERFICI
v1(x0, y0) =
1
0
zx(x0, y0)
,v2(x0, y0) =
0
1
zy(x0, y0)
N(x0, y0) =
zx(x0, y0)
zy(x0, y0)
1
.
Per il seguito `e importante ricordare la formula per ||N(r)|| nel caso di una superficie
cartesiana:
||N(x0, y0)|| =q1 + [zx(x, y)]2+ [zy(x, y)]2.(6.16)
Si confronti questa formula con la (6.6).
Studiamo ora come cambiano i vettori v1(u0, v0), v2(u0, v0) e il vettore N(u0, v0) sotto
l’azione dei cambiamenti di parametro. Sia u=u(t, s), v=v(t, s) una trasformazione
biunivoca (e di classe C1) da una regione su e consideriamo la parametrizzazione
r(t, s) = x(u(t, s), v(t, s))i+y(u(t, s), v(t, s))j+z(u(t, s), v(t, s))k.
Le derivate rispetto ad ted ssi calcolano mediante la regola di derivazione a catena.
Poniamo:
a=ut(t, s), b =vt(t, s), c =us(t, s), d =vs(t, s).
Per semplicit`a di notazioni, scriviamo xuinvece di xu(u(t, s), v(t, s)) (e analoga notazione
per le derivate di ye di z, e per le derivate rispetto a v). Si ha:
rt(t, s) = [xua+xvb]i+ [yua+yvb]j+ [zua+zvb]k
rs(t, s) = [xuc+xvd]i+ [yuc+yvd]j+ [zuc+zvd]k
La componente lungo il versore kdel prodotto vettoriale rt(t, s)rs(t, s) `e
[(xuyuac +xvyvbd +xuyvad +xvyubc)(yuxuac +yvxvbd +yuxvad +yvxubc)]
= (xuyvxvyu)(ad bc).
Proseguendo in modo analogo al calcolo delle altre componenti si trova:
Teorema 202 Vale:
rt(u(t, s), v(t, s)) rs(u(t, s), v(t, s)) = (ad bc)ru(u(t, s), v(t, s)) rv(u(t, s), v(t, s)) .
Il numero ab bc `e lo jacobiano del cambiamento di parametro. Esso `e positivo per la
definizione di cambiamento di parametro.
Teorema 203 effettuando un cambiamento di parametro la normale alla superficie non
cambia e direzione e verso.
Per questa ragione si dice che i cambiamenti di parametro (che hanno jacobiano positivo)
lasciano invariata l’ orientazione della superficie.
Si dice che cambiano l’orientazione della superficie quelle trasformazioni che hanno
jacobiano negativo.
6.4. APPENDICI 197
Figura 6.10: Riferimento mobile su una curva nello spazio
2
−1
−0.8
−0.6
−0.4
−0.2
0
0.2
0.4
0.6
0.8
1
x
y
z
t
n
b
6.4 Appendici
6.4.1 Appendice: le formule di Frenet per curve nello
spazio
Torniamo a considerare le curve nello spazio e completiamo le considerazioni svolte al pa-
ragrafo 6.1.3. In quel paragrafo abbiamo definito la tangente t(s) e la normale n(s) ad
una curva. Il piano identificato dai vettori t(s) e n(s), applicati in r(s), si chiama il piano
osculatore alla curva nel punto r(s).
Notiamo ora che t(s)·n(s) `e identicamente zero e quindi ha derivata nulla. Dunque,
t(s)·n(s) = t(s)·n(s) = k(s).(6.17)
Introduciamo ora il versore b(s), definito da
b(s) = t(s)n(s).
Il versore b(s) `e quindi ortogonale a t(s) e n(s) ed orientato in modo tale che la terna
(t(s),n(s),b(s)) sia orientata positivamente. Si veda la figura 6.10 per un esempio.
Il sistema di assi cartesiano ortogonali che abbiamo descritto varia da punto a punto
della curva. Per questa ragione si chiama sistema di riferimento mobile sulla curva.
Il vettore b(s) si chiama il versore binormale alla curva.
La derivata di b(s) `e ortogonale a b(s) perch´e ||b(s)|| = 1 per ogni se quindi appartiene
al piano di t(s) e n(s) per ogni s. Si ha quindi
b(s) = α(s)t(s) + β(s)k(s).
198 CAPITOLO 6. CURVE E SUPERFICI
D’altra parte,
b(s) = [t(s)] n(s) + [t(s)] n(s).
Ora, t(s) `e colineare con n(s) e quindi il loro prodotto vettoriale `e nullo. Rimane quindi
b(s) = [t(s)] n(s).
Il vettore [t(s)] n(s) `e ortogonale sia a t(s) che a n(s). E’ quindi un multiplo di n(s).
Dunque, per ogni sesiste un numero τ(s) tale che
b(s) = τ(s)n(s).(6.18)
Da qui si trova
τ(s) = b(s)·n(s).
Essendo b(s)·n(s) identicamente zero, derivando si trova anche che
τ(s) = b(s)·n(s).(6.19)
Il numero τ(s) pu`o essere positivo negativo o nullo. Esso si chiama la torsione della
curva.
Cerchiamo ora di esprimere n(s) mediante t(s) e b(s). Ci`o `e possibile perch`e n(s),
essendo ortogonale a n(s), `e nel piano di t(s) e di b(s). Dunque
n(s) = γ(s)t(s) + δ(s)b(s).(6.20)
Moltiplicando scalarmente i due membri di (6.20) per t(s) ed usando (6.17) si trova
γ(s) = k(s).
Analogamente, moltiplicando scalarmente (6.20) per b(s) ed usando (6.19) si trova
δ(s) = n(s)·b(s) = τ(s).
Si trova quindi che i versori t(s), n(s), b(s) verificano
t(s) = k(s)n(s)
n(s) = k(s)t(s) + τ(s)b(s)
b(s) = τ(s)n(s).
Si chiamano queste le equazioni di Frenet per curve di R3.
Il sistema di riferimento dato dai tre versori t(s), n(s), b(s) applicati in r(s) si chiama
ancora il riferimento mobile sulla curva.
6.4.2 Appendice: Curve in Rn
La maggior parte delle considerazioni che abbiamo svolto si estendono senza alcuna difficolt`a
a curve
γ:tr(t),rRn.
6.4. APPENDICI 199
Per esempio `e ancora vero che una curva in Rnche `e semplice `e identificata dal suo sostegno
a meno dell’orientazione; si definisce ancora la lunghezza dell’arco γponendo
Lγ=Zb
a||˙
r(t)||dt;
`e quindi possibile definire il parametro d’arco.
La tangente e la normale si definiscono ancora nel medesimo modo come per le curve in
R3. Non esiste invece una unica binormale”. Per completare il il riferimento mobile sulla
curva si devono introdurre, oltre alla tangente ed alla normale, altri n2 vettori e quindi
le equazioni di Frenet diventano pi`u complesse.
200 CAPITOLO 6. CURVE E SUPERFICI
Capitolo 7
Integrazione delle funzioni di
pi`u variabili
In questo capitolo introdurremo gli integrali di funzioni di due o tre variabili. Le idee che si
seguono per definire l’integrale sono simili a quelle che si usano per definire l’integrale delle
funzioni di una sola variabile e quindi le illustreremo per sommi capi1.
Una differenza importante tra le definizione di integrali per le funzioni di una o pi`u
variabili `e nella scelta dei domini di integrazione. Per le funzioni di una variabile `e naturale
scegliere gli intervalli. Per le funzioni di pi`u variabili c’`e molta pi`u libert`a. Noi sceglieremo
come domini di integrazione gli insiemi che sono delimitati da grafici di funzioni continue
(si veda pi`u avanti per una definizione pi`u precisa). Tali insiemi si chiameranno domini di
integrazione.
Studieremo la definizione dell’integrale di di una classe di funzioni che saranno costruite
a partire da funzioni continue su insiemi chiusi e limitati.
1sul piano non si introduce una relazione d’ordine; e quindi non si introdur`a per l’integrale
multiplo un concetto analogo a quello di integrale orientato che si introduce nel caso delle
funzioni di una variabile. Esiste per`o nel piano un “verso positivo di rotazione”. Questo
permetter`a di introdurre “integrali orientati” sulle superfici in un capitolo successivo.
201
202CAPITOLO 7. INTEGRAZIONE DELLE FUNZIONI DI PI `
U VARIABILI
Dovremo usare la seguente propriet`a delle funzioni che sono continue su un
qualsiasi insieme insieme chiuso e limitato D:
per ogni ǫ > 0 esiste δ > 0 con questa propriet`a:
se R`e un qualsiasi rettangolo contenuto in Dle cui diagonali hanno
lunghezza minore di δallora
0max
Rfmin
Rfǫ .
La propriet`a importante `e che la posizione di Rin Dnon ha importanza.
Inoltre, non abbiamo indicato esplicitamente le variabili della funzione perch´e questo
risultato vale per funzioni di un qualsiasi numero di variabili (anche per funzioni di
una sola variabile. In questo caso R= [a, b], nonostante che questo risultato non
sia stato provato nel corso di Analisi Matematica 1.)
Questa propriet`a delle funzioni continue su insiemi chiusi e limitati si chiama
continuit`a uniforme.
Introduciamo prima l’integrale di funzioni di due variabili, che presenteremo con mag-
giori dettagli, e poi l’integrale delle funzioni di tre variabili, che presenteremo in modo pi`u
conciso.
7.1 Integrazione delle funzioni di due variabili
Chiameremo dominio di integrazione semplice un insieme che ha una delle propriet`a se-
guenti:
`e trapezoide di una funzione y=g(x) continua definita su un intervallo limitato e
chiuso (dell’asse delle ascisse) oppure x=g(y) continua su un intervallo limitato e
chiuso (dell’asse delle ordinate);
oppure `e differenza insiemistica di trapezoidi.
Va notato esplicitamente che ogni dominio di integrazione semplice `e limitato, per
il Teorema di Weiestrass. Inoltre, assumiamo che il dominio di integrazione
semplice sia chiuso, ossia contenga i punti della sua frontiera. Nel caso
specifico di un dominio di integrazione semplice compreso tra due grafici di funzioni
della variabile x[a, b], includeremo nel dominio sia i due grafici che i due segmenti
che lo delimitano a destra (punti di ascissa a) ed a sinistra (punti di ascissa b).
Un insieme chiuso e limitato Dsi chiama dominio di integrazione quando si pu`o
rappresentare come unione di domini di integrazione semplici in modo tale che due qualsiasi
di essi non abbiano punti interni comuni (ossia, gli eventuali punti comuni a due domini di
integrazione semplici appartengono alle rette o ai grafici che li delimitano)2.
2si faccia attenzione al fatto che dominio” indica una insieme connesso ed aperto mentre
i “domini di integrazione” sono insiemi chiusi.
7.1. INTEGRAZIONE DELLE FUNZIONI DI DUE VARIABILI 203
Figura 7.1: Domini di integrazione
x
y
M
m
−1 −0.8 −0.6 −0.4 −0.2 0 0.2 0.4 0.6 0.8 1
−1
−0.8
−0.6
−0.4
−0.2
0
0.2
0.4
0.6
0.8
1
D1
D2
D3
D4
Per brevit`a un dominio di integrazione semplice si chiamer`a dominio semplice” ma `e
importante ricordare che `e un caso speciale di dominio di integrazione.
In conclusione, un dominio di integrazione si rappresenta (non in modo unico) come
unione di domini semplici
D=D1D2 ··· DnDiDjprivo di punti interni. (7.1)
La figura 7.1 mostra esempi di domini di integrazione. Quello a sinistra `e la parte del
trapezoide di una funzione y=g(x)x[a, b] che `e sopra alla retta orizzontale y=med
automaticamente sotto alla retta y=M= max g(x). E’ quindi la differenza insiemistica
tra il trapezoide di g(x) e quello della funzione che vale costantemente m. Il dominio di
integrazione a destra `e pi`u complesso, suddiviso mediante grafici di varie funzioni y=y(x),
oppure x=x(y), ciascuna continua e definita su un opportuno intervallo limitato e chiuso.
Osservazione 204 Si noti che:
un dominio di integrazione `e un insieme chiuso e limitato. Questo implica che una
funzione continua definita su un dominio di integrazione `e limitata.
Come abuso di linguaggio, se `e un dominio di integrazione, talvolta chiameremo
dominio di integrazione l’insieme dei suoi punti interni; ossia l’insieme privato delle
curve che lo delimitano. Anche in questo caso, le funzioni continue che integreremo
dovranno avere estenzione continua alla frontiera dell’insieme.
uno stesso dominio di integrazione pu`o rappresentarsi in pi`u modi come unione di
insiemi semplici: per esempio il trapezoide della funzione sin x, 0 xπ`e un
dominio di integrazione semplice che pu`o rappresentarsi anche come D1D2con D1
il trapezoide di sin x, 0 xπ/2 e D2quello di sin x,π/2xπ.
Si potrebbe provare che la chiusura di una regione di Jordan delimitata da una curva
regolare `e un dominio di integrazione; e quindi anche l’insieme ottenuto togliendogli
la regione delimitata da una seconda curva di Jordan regolare lo `e.
204CAPITOLO 7. INTEGRAZIONE DELLE FUNZIONI DI PI `
U VARIABILI
Figura 7.2: Suddivisione in rettangoli di un dominio di integrazione
−0.5 0 0.5 1 1.5 2 2.5
−0.5
0
0.5
1
1.5
2
2.5
3
3.5
−0.5 0 0.5 1 1.5 2 2.5
−0.5
0
0.5
1
1.5
2
2.5
3
3.5
Introduciamo ora la classe di funzioni per cui definiremo l’integrale3. Chiamiamo
integrabile una funzione f(x, y) definita su un dominio di integrazione D(o almeno nei
suoi punti interni) e con questa propriet`a: E’ possibile trovare una rappresentazione di D
come in (7.1) in modo tale che per ogni indice ila funzione f|Di(x, y) ammetta estensione
continua al dominio semplice Di. Ossia, gli eventuali punti di discontinuit`a della fun-
zione f(x, y)devono essere sulle rette o grafici che delimitano i domini semplici
che compongono D.
7.1.1 La definizione di integrale
Sia f(x, y) una funzione integrabile. Per definirne l’integrale, procediamo in questo mo-
do: definiamo l’integrale di f(x, y) su ciascuna dei domini semplici Die quindi definiamo
l’integrale su Dcome somma degli integrali sui domini Di.
Si noti che il dominio Dsi potr`a decomporre in pi`u modi e quindi andrebbe provato che
l’integrale di f(x, y) non dipende dalla decomposizione scelta per il dominio. Questo `e vero
ma noi non lo proveremo.
Per semplicit`a limitiamoci a illustrare la definizione dell’integrale di f(x, y) sul dominio
semplice rappresentato nella figura 7.1 a sinistra. Indichiamo con Ttale dominio semplice,
T={(x, y),0ab , m g(x)M}
Si segua il procedimento guardando la figura 7.2.
Dividiamo [a, b] in Nparti uguali con i punti a0=a,ak=kba
N. Consideriamo quindi
i segmenti verticali i cui punti hanno ascissa ake che sono contenuti in T, come in fig. 7.2,
a sinistra.
Suddividiamo ora anche il segmento [m, M] dell’asse delle ordinate in Ltratti uguali.
Le rette orizzontali i cui punti hanno ordinata uguale ai punti di suddivisione dell’intervallo
3si potrebbe definire l’integrale anche per funzioni con propriet`a assai pi`u generali, ma
questa classe di funzioni `e sufficiente praticamente per tutte le applicazioni.
7.1. INTEGRAZIONE DELLE FUNZIONI DI DUE VARIABILI 205
[m, M] disegnano una divisione dell’insieme Tin rettangoli completamente contenuti in T, e
inoltre certi sottoinsiemi a lati non rettilinei, che escludiamo. Si guardi la figura 7.2,
a destra.
In questo modo il trapezoide della funzione viene ad essere approssimato da una rete di
al pi`u N L rettangolini, che indichiamo con Ri,j , 0 iN1, 0 jL1.
Ciascuno di questi rettangoli ha area ba
N
Mm
L. Indichiamo con Ula loro unione.
Notiamo che nessuno dei rettangolini `e a cavallo del grafico di g(x) e che UT.
Per ipotesi, la funzione f(x, y) appartiene alla classe delle funzioni integrabili e quindi la
sua restrizione a Tammette estensione continua a tutti i punti del dominio di integrazione T,
che `e chiuso e limitato. Indichiamo ancora con f(x, y) tale estensione, che `e uniformemente
continua.
Costruiamo ora le somme
sN,L =X
i,j
min
(x,y)Ri,j
f(x, y)·Mm
L·ba
N
SN,L =X
i,j
max
(x,y)Ri,j
f(x, y)·Mm
L·ba
N
Queste somme sono estese a tutti i rettangoli che appartengono ad U.
Ora usiamo l’uniforme continuit`a di f(x, y). Si fissi un qualsiasi ǫ > 0 e il corrispondente
δ > 0. Se Ned Lsono abbastanza grandi, diciamo NN0,LL0, la diagonale di ciascuno
dei rettangoli costruiti misura meno di δe quindi per NN0,LL0si ha
0[max
Ri,j
f(x, y)min
Ri,j
f(x, y)] < ǫ .
In particolare
0SN0,L0sN0,L0 {somma delle aree dei rettangoli}ǫ[(ba)(Mm)] ǫ .
Ma,
0inf{SN,L} sup{sN,L} SN0,L0sN0,L0
{somma delle aree dei rettangoli}ǫ[(ba)(Mm)] ǫ .
Dunque
inf{SN,L}= sup{sN,L}
e questo numero si chiama l’ integrale di f(x, y) sul trapezoide T. Esso si indica col simbolo
ZT
f(x, y) dxdy .
In modo analogo si definisce l’integrale su ogno altro dominio Di. Si definisce quindi
ZD
f(x, y) dxdy=X
iZDi
f(x, y) dxdy . (7.2)
Osservazione 205 E’ ovvio dalla costruzione che abbiamo fatto che se f(x, y)0 allora
il suo integrale si interpreta come il volume del solido compreso tra l’insieme Ddel piano
206CAPITOLO 7. INTEGRAZIONE DELLE FUNZIONI DI PI `
U VARIABILI
z= 0 ed il grafico della funzione. Se in particolare si sceglie f(x, y) identicamente uguale
ad 1, si trova una numero che ha senso interpretare come area del dominio di integrazione.
Ossia per definizione:
area di D=ZD
1 dxdy . (7.3)
Se accade che D`e grafico di una funzione y=g(x)0 continua su [a, b] abbiamo due
diverse definizioni di area: quella appena scritta e quella data durante il corso di Analisi
Matematica 1: area del trapezoide di una funzione positiva uguale (per definizione!) al
suo integrale. Si tratta di due definizioni diverse ma vedremo che conducono al medesimo
numero. Un fatto da sottolineare `e questo: Rb
ag(x)dx`e l’area del trapezoide solo
se g(x)0. Invece, la (7.3) d`a il valore dell’area anche quando D`e trapezoide
di una funzione che cambia segno.
Talvolta, un integrale di una funzione di due variabili si chiama anche integrale doppio .
Per contrasto, l’integrale di una funzione di una sola variabile,
Zb
a
f(x) dx
si chiama anche integrale semplice .
7.1.2 Le propriet`a dell’integrale
Le propriet`a dell’integrale sono le stesse come nel caso degli integrali semplici:
la linearit`a: se αeβsono numeri e f(x, y), g(x, y) sono funzioni continue sullo stesso
dominio di integrazione D, vale
ZD
[αf(x, y) + βg(x, y)] dxdy=αZD
f(x, y) dxdy+βZD
g(x, y) dxdy;
additivit`a: se il dominio di integrazione D`e unione di due,
D=D1D2
e se la funzione f(x, y) `e integrabile sia su D1che su D2, allora `e anche integrabile
su D, e viceversa; e inoltre
ZD
f(x, y) dxdy=ZD1
f(x, y) dxdy+ZD2
f(x, y) dxdy .
monotonia: f(x, y)g(x, y) per ogni (x, y) D implica
ZD
f(x, y) dxdyZD
g(x, y) dxdy .
Dalla monotonia si deduce
ZD
f(x, y) dxdyZD|f(x, y)|dxdy .
7.1. INTEGRAZIONE DELLE FUNZIONI DI DUE VARIABILI 207
Anche il teorema della media si pu`o riformulare. Indichiamo con A(D) l’area di D,
calcolata sommando le aree delle singole regioni che la compongono.
Vale:
A(D)·min
(x,y)∈D f(x, y)ZD
f(x, y) dxdyA(D)·max
(x,y)∈D f(x, y).
Ne segue:
Teorema 206 Se Dǫ`e una circonferenza di raggio ǫe centro fissato vale
lim
ǫ0ZDǫ
f(x, y)dxdy= 0 .
7.1.3 Domini di integrazione definiti mediante curve di
Jordan
Sia
γ:tx(t)i+y(t)j
una curva di Jordan regolare. Applicando il Teorema della funzione implicita si vede che il
sostegno `e localmente un grafico e si potrebbe provare che il sostegno `e grafico di un numero
finito di funzioni. Dunque, l’unione della regione γ, interna alla curva γe del suo sostegno
`e un dominio di integrazione. Come si `e notato all’osservazione 204, diremo che la regione
γstessa `e un dominio di integrazione e quindi `e possibile:
integrare una funzione su una regione di Jordan, se la funzione `e continua sulla
chiusura della regione;
assegnare un’area ad una regione di Jordan (ci`o che si fa integrando la funzione
identicamente uguale ad 1);
approssimare l’area di una regione di Jordan mediante la somma delle aree di un
numero finito di rettangoli con lati paralleli agli assi coordinati.
Con lo stesso abuso di linguaggio illustrato all’osservazione 204, diremo ancora che una
regione di Jordan si pu`o approssimare mediante rettangoli.
7.1.4 Riduzione di integrali doppi ad integrali iterati
Torniamo a considerare le somme sN,L ed SN,L che servono per definire l’integrale doppio.
Consideriamo per esempio le sN,L:
sN,L =X
i,j min
(x,y)Ri,j
f(x, y)·Mm
L·ba
N.
Calcoliamo le somme prima di tutto sommando i termini che corrispondono a rettango-
lini che appartengono alla stessa striscia verticale, ossia scrivendo
sN,L =X
i,j min
(x,y)Ri,j
f(x, y)·Mm
L·ba
N
=X
i
X
jmin
(x,y)Ri,j
f(x, y)·Mm
L
·ba
N.
208CAPITOLO 7. INTEGRAZIONE DELLE FUNZIONI DI PI `
U VARIABILI
Fissiamo un punto xiin ciascuno degli intervalli [ai, ai+1). Si mostra che per L+
tende a zero la differenza tra la parentesi graffa e l’integrale
Zg(xi)
0
f(xi, y) dy
ove xi`e un qualsiasi punto dell’intervallo [ai, ai+1); e quindi che
sN,L =X
i,j min
(x,y)Ri,j
f(x, y)·Mm
L·ba
N
=X
i
ba
NZg(xi)
0
f(xi, y) dy+ǫ(L, N)
con
lim ǫ(L, N) = 0 ;
Ma, per N+, le somme
N1
X
i=0
ba
NZg(xi)
0
f(xi, y) dy
convergono all’integrale della funzione di x
Zg(x)
0
f(x, y) dy ,
ossia all’integrale iterato di f(x, y). Dunque, per calcolare RDf(x, y) dxdysi pu`o procedere
come segue:
1. Si proietta ortogonalmente Dsull’asse delle ascisse, ottenendo un intervallo [a, b];
2. Si traccia la retta parallela all’asse delle ordinate e che passa da x[a, b]. Si indica
con Sxl’intersezione di tale retta con D. L’insieme Sx`e unione di un numero finito
di intervalli.
3. Si ha: RDf(x, y) dxdy=Rb
ahRSxf(x, y) dyidx .
Si veda la figura 7.3
Naturalmente la stessa procedura vale anche scambiando il ruolo dell’asse delle ascisse
con quello dell’asse delle ordinate.
Consideriamo un caso particolare: supponiamo che Dsia il trapezoide della funzione
k(x), x[a, b], e che la funzione integranda sia identicamente uguale ad 1. Sia inoltre k(x)
non negativa. In tal caso,
ZD
1 dxdy=Zb
a"Zk(x)
0
1 dy#dx=Zb
a
k(x) dx
in accordo con quanto detto nell’osservazione 205.
Il metodo visto “riduce” il calcolo di un integrale doppio a quello di un integrale iterato,
e quindi a quello di due integrali semplici. Per`o esso pu`o anche usarsi al contrario, per
ricondurre il calcolo di un integrale iterato calcolato prima rispetto ad xepoi rispetto ad y
al calcolo di un integrale doppio; e quindi al calcolo di un integrale iterato calcolato prima
rispetto ad yepoi rispetto ad x. Quando si opera in questo modo su un integrale iterato
si dice che si scambia l’ ordine d’integrazione .
7.2. INTEGRAZIONE DELLE FUNZIONI DI TRE VARIABILI 209
Figura 7.3: Riduzione di un integrale doppio
−1.5 −1 −0.5 0 0.5 1 1.5
−2
−1
0
1
2
3
4
5
x
y
a b
x1 x2 x3
Sx1
Sx2
Sx2
sx3
7.2 Integrazione delle funzioni di tre variabili
L’integrazione delle funzioni di tre variabili si introduce in modo del tutto analogo a quella
relativa a funzioni di due variabili. Prima di tutto si scelgono i domini di integrazione
semplici: questi sono i solidi delimitati dai grafici di due funzioni, per esempio
φ(x, y)zψ(x, y)
con (x, y) D, dove D`e un dominio di integrazione semplice per funzioni di due variabili.
Anche i domini di integrazioni semplici per funzioni di tre variabili sono insiemi chiusi.
Come dominio di integrazione per funzioni di tre variabili intendiamo l’unione di un
numero finito di tali domini semplici, purch´e l’intersezione tra due qualsiasi di essi non
contenga punti interni.
Definiamo ora l’insieme delle funzioni integrabili. Una funzione definita su un dominio
di integrazione si dice integrabile quando la sua restizione all’interno di ciascuno dei domini
semplici ammette estensione continua al dominio semplice stesso.
Ci`o detto `e facile dividere un dominio di integrazione in piccoli” parallelepipedi e
costruire le analoghe delle somme sNed SNe quindi definire
ZD
f(x, y, z) dxdydz
come estremo comune ai due insiemi {sN,L,K}ed {SN,L,K}che ora verranno a dipendere
da tre indici N,L,K.
Si ottiene cos`ı un integrale che si chiama anche integrale triplo .
210CAPITOLO 7. INTEGRAZIONE DELLE FUNZIONI DI PI `
U VARIABILI
Osservazione 207 Per definizione, il volume di un dominio di integrazione D R3`e
ZD
1 dxdydz .
Le propriet`a elencate al paragrafo 7.1.2 per gli integrali doppi valgono anche per gli
integrali tripli. Per gli integrali tripli, il Teorema 210 si riformula come segue:
Teorema 208 Sia (u, v, w)7→ (x(u, v, w), y(u, v, w), z(u, v, w)) una trasformazione conti-
nua da un dominio di integrazione D1ad un dominio di integrazione D. Supponiamo che la
trasformazione ammetta derivate parziali continue nei punti interni di D1e che le derivate
abbiano estensione continua alla frontiera, e che il suo determinante jacobiano J(u, v, w)
non si annulli.
Per ogni funzione f(x, y, z)continua su Dsi ha:
ZD
f(x, y, z)dxdydz=ZD1
f(x(u, v, w), y(u, v, w), z(u, v, w)) J(u, v, w)dudvdw .
Invece, il metodo di riduzione va esaminato esplicitamente.
7.3 Formula di riduzione per gli integrali tripli
Il calcolo degli integrali tripli si pu`o ricondurre al calcolo di integrali iterati. Illustriamo il
metodo nel caso particolare in cui il dominio di integrazione D`e compreso tra due grafici
D={(x, y, z)|φ(x, y)zψ(x, y)}.
Indichiamo con
Dz={(x, y)| wper cui (x, y, w) D}
ossia la proiezione ortogonale di Dsul piano z= 0. Dunque:
se (x, y)/ Dzallora la retta verticale per (x, y) non interseca D;
se (x, y) Dzallora la retta verticale per (x, y) interseca Dnel segmento verticale
di estremi (x, y, φ(x, y)) e (x, y, ψ(x, y)). Si noti che questo segmento potrebbe essere
ridotto ad un punto.
Vale:
ZD
f(x, y, z) dxdydz=ZDz"Zψ(x,y)
φ(x,y)
f(x, y, z) dz#dxdy .
In questo modo il calcolo dell’integrale triplo si `e ricondotto al calcolo di un integrale
semplice, seguito da quello di un integrale doppio4.
Si veda la figura 7.4, a sinistra.
Si pu`o anche procedere in modo diverso: supponiamo di sapere che Dzsia delimitato
da due grafici, per esempio
Dz={(x, y)|h(y)xk(y)}
4questo metodo di riduzione si chiama anche “metodo di riduzione per fili”.
7.3. FORMULA DI RIDUZIONE PER GLI INTEGRALI TRIPLI 211
Figura 7.4: Riduzione per fili e per strati di un integrale triplo
−1
−0.5
0
0.5
1
−1
−0.5
0
0.5
1
0
0.2
0.4
0.6
0.8
1
(x,y)
S(x,y)
−1 −0.5 00.5 1−1
−0.5
0
0.5
1
0
0.2
0.4
0.6
0.8
1
1.2
1.4
y
x
z
Sy
e sia [a, b] il dominio comune ad h(y) e k(y). Allora vale:
ZD
f(x, y, z) dxdydz=Zb
a"Z˜
Dy
f(x, y, z) dxdz#dy
dove ˜
Dy`e l’intersezione di Dcol piano parallelo agli assi xez, passante per il punto (0, y, 0)5.
Si veda la figura 7.4, a destra.
7.3.1 Integrazione e Cambiamento di variabili
Nel caso degli integrali semplici, sotto opportune ipotesi si prova la formula
Zb
a
f(x) dx=Zφ1(b)
φ1(a)
f(φ(t))φ(t) dt .
Si noti per`o che φ1(a) pu`o anche essere maggiore di φ1(b), ci`o che `e lecito perch´e nel
caso degli integrali semplici abbiamo definito l’integrale orientato. D’altra parte, questa
formula non si prova usando direttamente le propriet`a dell’integrale. Piuttosto si prova che
questa formula vale per il calcolo delle primitive, e quindi anche per il calcolo dell’integrale
grazie al teorema fondamentale del calcolo integrale. Mostriamo come a questa formula,
sotto opportune ipotesi, si possa anche giungere direttamente dalla definizione di integrale
semplice.
Sia f(x) una funzione continua definita su in intervallo [a, b] e sia x=φ(t) una funzione
monotona strettamente crescente da un intervallo [α, β] su [a, b], che `e anche derivabile.
Bisogna ricordare questi fatti:
nella definizione di integrale la suddivisione dell’intervallo [a, b] non `e necessariamente
fatta mediante punti equidistanti;
5questo metodo di riduzione si chiama anche “metodo di riduzione per strati”.
212CAPITOLO 7. INTEGRAZIONE DELLE FUNZIONI DI PI `
U VARIABILI
nella definizione di integrale, si possono considerare le somme
n
X
i=1
f(ξi)[ai+1 ai] (7.4)
con punti ξi(ai, ai+i)qualsiasi.
Quando la finezza della partizione tende a zero, le somme (7.4) tendono all’integrale
Zb
a
f(x) dx .
Essendo la funzione φmonotona e suriettiva, ogni aiproviene da un unico αi,
ai=φ(αi).
Dunque la somma (7.4) `e anche uguale a
n
X
i=1
f(ξi)[φ(αi+1)φ(αi)] .
Questa non `e una somma di quelle che conducono alla definizione di un integrale, ma ad
essa facilmente si riconduce. Infatti, dal Teorema di Lagrange, esiste un punto citale che
[φ(αi+1)φ(αi)] = φ(ci)(αi+1 αi).
Ricordando che i numeri ξisi possono scegliere in modo arbitrario, scegliamo ξi=φ(ci). La
monotonia di φmostra che ci(αi, αi+1). In questo modo la (7.4) diviene
n
X
i=1
f(φ(ci))φ(ci)[αi+1 αi].(7.5)
La finezza della partizione di [a, b] tende a zero se e solo se tende a zero la finezza della
partizione di [α, β]. Quando la finezza della partizione tende a zero, le somme (7.4) tendono
all’integrale di f(x), quelle di (7.5) tendono all’integrale di f(φ(t))φ(t). D’altra parte le
due somme hanno lo stesso valore e quindi si trova
Zb
a
f(x) dx=Zβ
α
f(φ(t))φ(t) dt .
Osservazione 209 Notiamo esplicitamente:
in questo calcolo la crescenza di φsi `e usata: `e αi< αi+1 proprio perch`e φ`e crescente.
Se invece φdecresce, sar`a β < α e in (7.5) si ha αi+1 < αie quindi al limite si trova
Zb
a
f(x) dx=Zβ
α
f(φ(t))φ(t) dt .
Ma ora β < α e quindi riordinando l’ordine degli estremi di integrazione si trova
Zb
a
f(x) dx=Zα
β
f(φ(t))φ(t) dt
=Zα
β
f(φ(t))[φ(t)] dt=Zα
β
f(φ(t))|φ(t)|dt .
7.3. FORMULA DI RIDUZIONE PER GLI INTEGRALI TRIPLI 213
il ruolo del numero φ(c): `e il coefficiente che trasforma la lunghezza di [αi, αi+1]
nella lunghezza di [ai, ai+1]. Si noti che se φnon si annulla su [a, b] (estremi inclusi)
esistono numeri m,Mtali che
m|αiαi+1| |aiai+1| M|αiαi+1|.
Nel caso degli integrali semplici, la formula vale anche senza richiedere la monotonia
di φperch`e, intuitivamente, se per tche percorre [α, β] il punto φ(t) percorre pi`u
volte un intervallo [x, x′′][a, b], deve percorrerlo un numero dispari di volte, in
versi opposti; e grazie all’esistenza dell’integrale orientato, i contributi dei passaggi
2 e 3 si elidono, lo stesso per i passaggi 4 e 5 ecc. Un fenomeno analogo non potr`a
aversi per funzioni di pi`u variabili e quindi in tal caso dovremo imporre a φdi essere
biunivoca.
Vediamo ora quali problemi si incontrano nel cercare di estendere il ragionamento appena
fatto a funzioni di pi`u variabili. In questo caso dovremo avere f(x, y) definita su un dominio
di integrazione De dovremo avere una trasformazione (x, y) = Φ(u, v) = (φ1(u, v), φ2(u, v))
da un dominio di integrazione Dnel dominio di integrazione T.
La Φ dovr`a essere biunivoca da Dsu De differenziabile (un’ulteriore condizione si dir`a
in seguito).
L’integrale di f(x, y) si definisce suddividendo Din tanti piccoli rettangoli, diciamo Ri.
Un rettangolo Ri`e immagine mediante Φ di un sottoinsieme R
idi Dche per`o non `e un
rettangolo. Se la Φ `e lineare R`e un parallelogramma, altrimenti `e una figura pi`u complessa.
Ci`o nonostante, si potr`a tentare di ripetere gli argomenti visti sopra se:
si potr`a trovare una relazione tra l’area di Rie quella di R
i;
l’area dei rettangoli Ritende a zero se e solo se l’area degli insiemi R
itende a zero.
La relazione tra l’area di Rie quella di R
i`e nota nel caso in cui la trasformazione Φ sia
lineare: `e
(area di Ri) = |det Φ|(area di R
i).
Qui Φ indica la matrice della trasformazione Φ, calcolata rispetto a coordinate ortogonali.
Nel caso non lineare una formula analoga alla precedente ancora vale, con un errore che
`e di ordine superiore rispetto all’area di R, quando questa tende a zero.
Questo risponde alla prima questione. La seconda richiesta, l’area degli Ritende a zero
se e solo se l’area degli R
itende a zero, `e soddisfatta quando det Φ 6= 0 su D.
Con queste informazioni, nel caso in cui Φ sia una trasformazione lineare `e relativamente
facile provare il risultato seguente, mimando la dimostrazione vista sopra per il caso di
funzioni di una variabile. Nel caso in cui Φ sia non lineare, il risultato seguente vale ancora
ma la dimostrazione `e piuttosto complessa:
Teorema 210 Siano DeDdue domini di integrazione. Sia
(x, y) = Φ(u, v) = (φ1(u, v), φ2(u, v))
una trasformazione invertibile da Dsu D. Supponiamo che questa trasformazione sia di
classe C1su una regione che contiene D.
Sia det J(u, v)lo jacobiano della trasformazione. Supponiamo che det J(u, v)non si
annulli su D.Sotto queste condizioni vale:
ZD
f(x, y)dxdy=ZD
f(φ1(u, v), φ2(u, v)) · |det J(u, v)|dudv .
214CAPITOLO 7. INTEGRAZIONE DELLE FUNZIONI DI PI `
U VARIABILI
Come abbiamo detto, questo teorema estende il teorema di cambiamento di variabili
negli integrali semplici. Nell’uso per`o esso ha un ruolo diverso. Nel caso degli integrali
semplici il metodo di cambiamento di variabili si usa per trasformare la funzione in una di
cui sia pi`u facile trovare la primitiva. Nel caso degli integrali doppi si usa la trasformazione
di variabili per passare da un dominio pi`u complicato ad uno pi`u semplice. Per esempio, si
voglia calcolare
ZDpx2+y2dxdy
con Dla circonferanza x2+y21. Esprimendo xed ymediante le coordinate polari ρeθ,
si trova
x=ρcos θ , y =ρsin θ , 0ρ1,0θ2π .
Notando che lo jacobiano della trasformazione `e semplicemente ρ, il calcolo richiesto si riduce
a quello dell’integrale iterato
Z2π
0Z1
0
ρ2dρdθ=2
3π .
Osservazione 211 Si noti che lo jacobiano della trasformazione a coordinate polari si
annulla nell’origine e quindi il Teorema 210 a rigore non pu`o applicarsi. Si applichi per`o
il teorema ad una corona circolare ǫρ1 e poi si mandi ǫa zero. Il Teorema 206
mostra che il contributo della circonferenza di raggio ǫtende a zero e ci`o giustifica l’uso
delle coordinate polari per il calcolo precedente.
7.4 Alcuni jacobiani che `e importante ricorda-
re
Le trasformazioni di coordinate che si usano pi`u comunemente sono le trasformazioni a
coordinate polari o ellittiche nel piano, a coordinate cilindriche o sferiche nello spazio.
Si ha:
7.4. ALCUNI JACOBIANI CHE `
E IMPORTANTE RICORDARE 215
coordinate trasformazione jacobiano
Nel piano
polari (ρ, θ)x=ρcos θ
y=ρsin θρ
ellittiche (ρ, θ)x=aρ cos θ
y= sin θabρ
Nello spazio
cilindriche (ρ, θ, z)
x=ρcos θ
y=ρsin θ
z=z
ρ
sferiche (ρ, θ, φ)
x=ρcos θsin φ
y=ρsin θsin φ
z=ρcos φ
ρ2sin φ
Si noti che nella formula di cambiamento di coordinate per gli integrali multipli compare
il valore assoluto dello jacobiano, mentre la tavola precedente riporta lo jacobiano per sottoli-
neare che i sistemi di coordinate che abbiamo introdotto, con le coordinate che si susseguono
nell’ordine indicato nella definizione delle coordinate, hanno jacobiano positivo. Dunque la
matrice jacobiana di tali trasformazioni non altera l’orientazione di R3.
7.4.1 Volumi delimitati da superfici di rotazione
Consideriamo il grafico di una funzione sul piano (y, z), descritto dall’equazione z=f(y).
Per fissare le idee, supponiamo che la funzione sia definita (e continua) su [0, Y ] e che
prenda valori positivi.
Facendo ruotare i punti del grafico intorno all’asse z, si trova la superficie descritta
dall’equazione
z=fpx2+y2.
Si vuol calcolare il volume dell’insieme
V=n(x, y, z)|0zfpx2+y2o;
ossia il volume dell’insieme compreso tra il piano z= 0 e la superficie.
Vogliamo quindi calcolare ZV
dxdydz .
Passiamo a coordinate cilindriche
x=rcos θ
y=rsin θ
z=z .
216CAPITOLO 7. INTEGRAZIONE DELLE FUNZIONI DI PI `
U VARIABILI
Si calcola facilmente che lo jacobiano della trasformazione `e r. Dunque va calcolato
ZR
rdrdzdθ.
L’insieme R`e ora
R={(r, θ, z)|0θ2π , 0rY , 0zf(r)}.
Dunque, riducendo l’integrale triplo ad integrali iterati si trova
V=Z2π
0"ZY
0"Zf(r)
0
1·rdz#dr#dθ= 2πZY
0
rf (r) dr . (7.6)
Supponiamo invece che il grafico che si fa ruotare sia dato mediante una funzione y=
f(z), 0 zZ.
Passando a coordinate cilindriche
x=rcos θ
y=rsin θ
z=z ,
si deve integrare ora sull’insieme
˜
R={(r, θ, z)|0θ2π , 0zZ , 0rf(z)}.
Dunque,
V=ZV
1 dxdydz=Z2π
0"Zz
0 Zf(z)
0
1·rdr!dz#dθ=πZZ
0
f2(z) dz . (7.7)
Questa formula si chiama Formula di Guldino .
L’interpretazione geometrica di queste formule si capisce facilmente approssimando gli
integrali semplici mediante le somme di Riemann, che conducono alla definizione stessa
degli integrali. Consideriamo prima di tutto l’integrale (7.6). Consideriamo una partizione
dell’intervallo [0, Y ] mediante i punti yi. Le somme di Riemann inferiori hanno forma
2πhXrif(ri)(yi+1 yi)i
ove ri`e un punto di minimo della funzione rf (r) nell’intervallo [yi+1, yi].
Il punto (0, ri,0) dell’assse delle ordinate ruota, per descrivere la superficie, sulla circon-
ferenza di raggio ri. Dunque, 2πri(yi+1 yi) `e circa l’area della corona circolare descritta,
durante la rotazione, dal segmento [yi+1, yi]. Dunque, 2πri(yi+1 yi)f(ri) `e (circa) il volume
del pi`u alto “guscio cilindrico” che insiste su tale corona circolare, e che `e sotto al grafico
della funzione.
Invece, le somme di Riemann dell’integrale (7.7) si ottengono dividendo il segmento
[0, Z] con i punti zi. Le somme di Riemann sono
πhXf2(˜zi)(zi+1 zi)i,˜zi[zi, zi+1].
Ciascun addendo πf2(˜zi)(zi+1 zi) rappresenta circa il volume di un cilindretto di raggio
f(˜zi) e base sul segmento [zi+1, zi]: in questo caso il volume si approssima come somma dei
volumi di tali cilindretti.
La figura 7.5 illustra a sinistra il primo ed a destra il secondo caso (il volume da calcolare
`e quello del solido compreso tra la parte di paraboloide disegnata ed il piano z= 0).
7.5. APPENDICI 217
Figura 7.5: Volume di una superficie di rotazione
−2
−1
0
1
2
−2
−1
0
1
2
0
0.5
1
1.5
2
2.5
3
3.5
4
−2 −1 012
−2
−1
0
1
2
0
0.5
1
1.5
2
2.5
3
3.5
4
7.5 Appendici
7.5.1 Appendice: Integrali impropri
Nel caso degli integrali di una variabile, `e stato naturale definire
Z+
0
f(x) dx= lim
R+ZR
0
f(x) dx .
Una definizione analoga nel caso di integrali doppi `e `e molto pi`u delicata. Per vedere la
ragione, consideriamo una funzione f(x, y) definita su un insieme illimitato I, che interseca
ogni disco
DR={(x, y)|x2+y2R2}
in un dominio di integrazione. Allora, si pu`o definire
ZI
f(x, y) dxdy= lim
R+ZIDR
f(x, y) dxdy .
Per`o questa definizione privilegia i dischi. Niente garantisce che si giunga al medesimo limite
se, invece di dischi, si considerano i quadrati
QR={(x, y)| |x| R , |y| R}.
L’esempio seguente mostra che in generale usando dischi od usando quadrati si trovano
comportamenti diversi.
Esempio 212 L’insieme I`e il primo quadrante e la funzione che si considera `e
f(x, y) = sin x2+y2.
L’integrale si DRsi calcola immediatamente passando a coordinate polari:
ZDR
f(x, y) dxdy=π
41cos R2,
218CAPITOLO 7. INTEGRAZIONE DELLE FUNZIONI DI PI `
U VARIABILI
privo di limite per R+.
L’integrale su QRsi calcola in coordinate cartesiane:
ZQR
f(x, y) dxdy=ZQR
(sin x2cos y2+ cos x2sin y2) dxdy
="ZR
0
sin x2dx#"ZR
0
cos y2dy#+"ZR
0
cos x2dx#"ZR
0
sin y2dy#.
Questi integrali non possono calcolarsi in modo esplicito, ma `e possibile provare che il limite
per R+`e finito. Infatti, si consideri per esempio
ZR
0
cos x2dx=Z1
0
cos x2dx+Z+
1
cos x2dx .
Integrando per parti, proviamo che `e finito il limite6:
lim
R+ZR
1
cos x2dx .
ZR
1
cos x2dx=ZR
1
[2xcos x2]1
2xdx=ZR
1
1
2xd sin x2
=1
2Rsin R2sin 1 + ZR
1
1
2x2sin x2dx .
E ora,
lim
R+
1
2Rsin R2= 0
mentre
lim
R+ZR
1
1
2x2sin x2dx
esiste finito perch´e |1
2x2sin x2|< M/x2ed
Z+
1
1/x2dx= 1 .
Si pu`o per`o provare che se esiste finito
lim
R+ZDR|f(x, y)|dxdy(7.8)
allora esiste finito
6con tecniche diverse si potrebbe anche provare che
Z+
0
sin x2dx=Z+
0
cos x2dx=π
22.
Questi due integrali si incontrano in problemi di ottica e si chiamano integrali di Fresnel .
7.5. APPENDICI 219
lim
R+ZDR
f(x, y) dxdy .
Sia inoltre Dnuna successione di domini di integrazione con questa propriet`a: esiste un
disco di raggio Rncontenuto in Dn, ed Rn+. Se vale (7.8) allora
lim
R+ZDR
f(x, y) dxdy= lim
R+ZDR
f(x, y) dxdy .
Questo numero si chiama integrale improprio su R2e la condizione (7.8) assicura che
l’integrale improprio non dipende dal modo con cui viene calcolato, usando gli insiemi Dn
con la propriet`a suddetta7, che Dncontiene un disco di raggio Rn+.
Considerazioni del tutto analoghe valgono anche nel caso in cui si consideri una funzione
f(x, y) definita su un dominio di integrazione D, ma tale che
lim
(x,y)(x0,y0)|f(x, y)|= +.
Sia Dǫun dico di raggio ǫ > 0 e centro (x0, y0) e supponiamo che f(x, y) sia integrabile su
D Dǫ. Supponiamo che
lim
ǫ0ZDDǫ|f(x, y)|dxdy=L < +.(7.9)
Allora esiste finito anche il limite seguente, che si chiama l’ integrale improprio di f(x, y)
su D:
lim
ǫ0ZDDǫ
f(x, y) dxdy .
Anche in questo caso, la condizione (7.9) assicura che i dischi non hanno ruolo privilegiato
nella definizione dell’integrale.
Esempio 213 Sia Dil disco di centro (0,0) e raggio 1 e sia
f(x, y) = 1
hpx2+y2iγ.
Vogliamo capire per quali valori di γla funzione f(x, y) `e integrabile su D. Si deve quindi
calcolare ZDDǫ
1
hpx2+y2iγdxdy .
Passando a coordinate polari, `e immediato calcolare che quest’integrale `e
2πZ1
ǫ
ρ1
ργdρ .
7invece se per esempio gli insiemi Dndiventano via via “pi`u lunghi e sottili”, niente pu`o
dirsi del limite degli integrali calcolati su di essi.
220CAPITOLO 7. INTEGRAZIONE DELLE FUNZIONI DI PI `
U VARIABILI
Il limite per ǫ0 esiste finito se e solo se
1γ > 1 ossia se γ < 2.
Si confronti col caso delle funzioni di una variabile:
Z1
0
1
xγdx
esiste se e solo se γ < 1.
Considerazioni del tutto analoghe valgono per gli integrali tripli. In particolare, si
consideri l’analogo dell’esempio 213 e si provi che
Zx2+y2+z2<1
1
hpx2+y2+z2iγdxdydz
esiste finito se e solo se γ < 3.
7.5.2 Appendice: Teorema dei valori intermedi e Teo-
rema di Brower
Il Teorema dei valori intermedi per funzioni a valori reali e continue su una regione connessa
`e stato provato al cap. 4, si veda il Teorema 130. Mostriamo che la formula di cambiamento
di variabili per gli integrali impropri permette di provare un teorema dei valori intermedi
anche per funzioni da R3in e:
Teorema 214 ( dei valori intermedi )Sia φ(r)una funzione che trasforma la palla
B={r= (x, y, z)| ||r||2=x2+y2+z21}
in se stessa e che inoltre
`e biunivoca;
`e di classe C1
verifica φ(r) = rnei punti della frontiera di B; ossia nei punti tali che ||r|| = 1.
Sotto queste ipotesi, la trasformazione φ(r)`e suriettiva.
Dim.Per assurdo, supponiamo che esista un punto r0che non appartiene all’immagine di
φ. Mostreremo in seguito che esiste una sferetta8B1di centro r0nessuno dei cui punti
appartiene all’immagine di φ. Sia ǫ > 0 il raggio di B1.
Sia f(r) la funzione cos`ı definita:
f(r) = 1 se rB,||rr0|| < ǫ/2;
f(r) = 0 altrimenti.
8si noti che r0potrebbe avere norma 1
7.5. APPENDICI 221
La funzione f(r) non `e continua ma `e integrabile e
ZB
f(x, y, z) dxdydz > 0.
Calcoliamo quest’integrale usando la formula di sostituzione di variabile: L’integrale `e anche
uguale a
ZB
f(φ(x, y, z))Jφ(x, y, z) dxdydz .
Quest’integrale per`o `e nullo, perch´e φ(x, y, z) prende valori solo nell’insieme in cui la funzione
f(x, y, z) `e nulla.
Questa contraddizione prova che il punto r0non pu`o esistere.
Per completare la dimostrazione, mostriamo ora l’esistenza della palla Bǫ. Proviamo
che se la palla Bǫnon esiste allora anche r0appartiene all’immagine di φ. Supponiamo
quindi che ogni palla di centro r0contenga punti dell’immagine di φ. In tal caso, esiste una
successione {rn}di punti di Btale che φ(rn)r0. Per il Teorema di Bolzano-Weierstrass,
la successione {rn}ammette una s.successione convergente: rnkˆr e
lim
kφ(rnk) = φ(r0).
Dunque, per continuit`a si ha
φ(ˆr) = φ(r0).
Ci`o completa la dimostrazione.
Naturalmente, la dimostrazione precedente pu`o applicarsi al caso di funzioni definite su
R2.
Osservazione 215 E’ possibile provare che il teorema precedente vale supponendo sola-
mente che la funzione φ(r) sia continua e verifichi φ(r) = rse ||r|| = 1, senza richiedere e
l’esistenza delle derivate e la biunivocit`a.
Un corollario importante `e il seguente:
Corollario 216 Non esiste una funzione φ(r)continua in Be tale che
φ(r) = rse ||r|| = 1;
||φ(r)|| = 1 per ogni rB.
Dim.Infatti, una tale funzione violerebbe il teorema dei valori intermedi.
Il teorema precedente ha una conseguenza importante, che va sotto il nome di Teorema
di punto fisso di Brower .
Teorema 217 Sia ψ(r)una funzione continua che trasforma la palla (chiusa) Bin se
stessa. Esiste un punto r0Btale che
ψ(r0) = r0.
222CAPITOLO 7. INTEGRAZIONE DELLE FUNZIONI DI PI `
U VARIABILI
Dim.Accenniamo alla dimostrazione. Supponiamo che tale punto non esista. Allora, per
ogni rBsi ha ψ(r)6=r. Consideriamo la semiretta di estremo ψ(r) e che passa per r.
Questa semiretta taglia la superficie della sfera in un punto che dipende da r. Associando
ad rtale punto, si costruisce una funzione φ(r) che verifica
kφ(r)k= 1 per ogni r,
φ(r) = rse ||r|| = 1 .
Inoltre, si potrebbe provare che la funzione φ(r) `e continua. Il Corollario 216 mostra
che tale funzione non pu`o esistere.
Si noti che la funzione φ(r) non `e biunivoca e nemmeno di classe C1. Per`o, abbiamo detto
che il Teorema 214 vale con la sola ipotesi che la φ(r) sia continua, si veda l’osservazione 215.
E quindi questa `e la sola ipotesi necessaria per il Corollario 216.
Capitolo 8
Integrali di curva e di superficie
Studiamo ora gli integrali definiti, invece che su intervalli o su parti di piano, su curve e su
superfici. Conviene premettere alcune considerazioni sui limiti di funzioni definite su curve
e, successivamente, su superfici.
In questa parte introdurremo certe notazioni e anche certi termini che non sono
affatto standardizzati. Riassumiamo alcuni termini nella tabella seguente
Termine che uso io Altri termini
integrale di curva di pri-
ma specie
integrale curvilineo;
integrale curvilineo di prima spe-
cie.
integrale di curva di se-
conda specie
integrale di linea;
integrale di linea di seconda spe-
cie.
integrale di superficie di
prima specie integrale superficiale.
integrale di superficie di
seconda specie
integrale di superficie;
integrale di flusso.
Il fatto da ricordare `e questo: gli integrali di prima specie integrano funzioni (a
valori reali) definite su curve o su superfici; gli integrali di seconda specie integrano
campi vettoriali definiti su curve o su superfici.
223
224 CAPITOLO 8. INTEGRALI DI CURVA E DI SUPERFICIE
N.B. Per ragioni tipografiche, alcune figure di questo capitolo si trovano alla
fine del capitolo stesso.
8.1 Funzioni definite su curve: la densit`a
Funzioni definite su curve, anche a valori vettoriali, si sono gi`a incontrate: abbiamo in-
contrato il campo vettoriale che ad ogni punto di una curva associa la tangente oppure
la normale alla curva nel punto stesso. Queste funzioni possono intendersi come funzioni
definite, per esempio, su R3, con dominio il sostegno della curva. La definizione dei limiti
per tali funzioni presenta per`o una particolarit`a che va evidenziata.
Sia γuna curva semplice e regolare, parametrizzata da
tr(t), t [a, b].
La curva `e semplice. Dunque, ogni coppia di punti r0er1di γindividua un arco
r(t), s [t0, t1],
con t0ed t1gli unici valori del parametro che verificano
r0=r(t0),r1=r(t1).
Introduciamo la notazione γr0,r1per indicare quest’arco e la notazione Lγ(r0,r1)per indicarne
la lunghezza (si veda il paragrafo (6.1.2):
Lγ(r0,r1)=Zt1
t0|r(ν)|dν .
Sia f(r) una funzione definita nei punti del sostegno di γ. Chiamiamo densit`a della
funzione fnel punto r0=r(t0)γil limite seguente:
ρf(r0) = lim
h0
f(r(t0+h)) f(r(t0))
Lγ(r(t0),r(t0+h))
.(8.1)
Notare che il rapporto incrementale ha per denominatore non lo scarto hdel parametro, ma la
lunghezza dell’arco che congiunge r(t0)con r(t0+h).Naturalmente, il denominatore `e lo
scarto del parametro se il parametro `e s, il parametro d’arco.
Se l’arco rappresenta un filo” di materiale non omogeneo e se f(r) rappresenta la mas-
sa totale tra l’estremo r(a) e il punto rdella curva, allora il limite precedente, se esiste,
rappresenta la usuale densit`a di massa del “filo”. Per`o, la funzione f(r) non `e necessaria-
mente positiva, e potrebbe essere una componente di un campo vettoriale, caso che si `e gi`a
incontrato definendo la normale a γin r0. Infatti, la definizione di limite (8.1) `e quella usata
nella definizione del versore normale.
8.2 Gli integrali di curva
Integrali di funzioni definite su curve possono definirsi in vari modi. Per dare definizioni
significative, `e necessario avere come guida degli esempi tratto dalla fisica. Prendiamo come
8.2. GLI INTEGRALI DI CURVA 225
guida il problema di calcolare la massa totale di un “filo”, nota la sua densit`a e il problema
di calcolare il lavoro di una campo di forze su un punto che si muove lungo una curva.
Il primo esempio conduce alla definizione di integrale di curva di prima specie mentre il
secondo esempio conduce alla definizione di integrale di curva di seconda specie.
8.2.1 Integrali di curva di prima specie
Consideriamo l’esempio seguente:
Esempio 218 supponiamo che tr(t), t[a, b] parametrizzi un arco realizzato con un
materiale non omogeneo, di densit`a ρ(r). Ricordando la definizione di densit`a, la massa
dell’arco si approssima dividendolo in segmenti di lunghezza δ, molto piccola, e sommando
la massa dei singoli pezzetti. Il modo migliore di fare ci`o, anche se non necessariamente il
pi`u semplice dal punto di vista del calcolo, consiste nel ricondursi alla parametrizzazione
canonica, rappresentando l’arco come sr(s), s[0, L]; dividere [0, L] con Npunti si,
si=iL/N e quindi costruire
N1
X
i=0
ρ(r(si))[si+1 si] =
N1
X
i=0
ρ(r(si))L/N .
Studiare quindi il comportamente di queste somme per N+, ossia quando la fi-
nezza della suddivisione dell’arco tende a zero. Questa `e niente altro che la costruzione
dell’integrale della funzione sρ(r(s)) sull’intervallo [0, L].
Sia ora f(r) una generica funzione, per semplicit`a continua. L’esempio precedente
suggerisce di definire
Zγ
f(r) ds
come segue: prima rappresentiamo l’arco in forma canonica, ossia mediante il parametro
d’arco e quindi definiamo
Zγ
f(r) ds=def ZL
0
f(r(s)) ds . (8.2)
Questa definizione richiede che l’arco γsia regolare, ed `e suggerita dal significato fisico
che vogliamo attribuire all’integrale. Per il calcolo pratico conviene per`o evitare di rappre-
sentare in forma canonica l’arco. Conviene di pi`u lavorare con la parametrizzazione r(t),
t[a, b], inizialmente assegnata. Notiamo che si passa dalla parametrizzazione r=r(t)
alla parametrizzazione canonica per mezzo del cambiamento di variabile t=t(s). Dunque
l’integrale a destra di (8.2) `e, in realt`a,
ZL
0
f(r(t(s))) ds .
Ossia, in (8.2), solo per semplicit`a di notazioni, abbiamo sostituito il simbolo r(s) alla
notazione pi`u completa r(t(s)).
La funzione s=s(t), ossia la funzione inversa della funzione t(s), `e derivabile, con
derivata
s(t) = |r(t)|.
226 CAPITOLO 8. INTEGRALI DI CURVA E DI SUPERFICIE
La sostituzione di variabile s=s(t) nell’integrale a destra di (8.2) mostra che vale:
Zγ
f(r) ds=Zb
a
f(r(t)) |r(t)|dt . (8.3)
Se l’arco `e in R3, quest’integrale `e
Zb
a
f(r(t))p[x(t)]2+ [y(t)]2+ [z(t)]2dt .
Se l’arco `e cartesiano, parametrizzata da
y=y(x), z =z(x), x [a, b]
allora
Zγ
f(r) ds=Zb
a
f(x, y(x), z(x))p1 + [y(x)]2+ [z(x)]2dx .
L’integrale appena definito si chiama integrale di curva di prima specie . La definizione
stessa mostra che esso non dipende dalla parametrizzazione scelta per rappresentare la curva.
Pi`u ancora, se si cambia la variabile tmediante la trasformazione t=t(τ) = b+aτ,
τ[a, b], il valore dell’integrale non cambia, ossia:
Teorema 219 l’integrale di curva di prima specie non cambia n´e cambiando la parametriz-
zazione e cambiando il verso di percorrenza dell’arco.
Il fatto che l’integrale di curva di prima specie non dipenda dalla parametrizzazione mostra
che, per ogni fissata funzione f(τ), esso `e una propriet`a geometrica della curva.
Il fatto che l’integrale di curva di prima specie non cambi valore cambiando il verso di
percorrenza si scrive come segue:
Zγ
f(r) ds=Zγ
f(r) ds
Notiamo infine la disuguaglianza seguente:
Teorema 220 Sia f(r)una funzione continua e sia |f(r)|< M in ogni punto rdel sostegno
di γ. Allora,
Zγ
f(r)dsM Lγ.
In particolare, si consideri un arco γparametrizzato da
γ:tr(t), t [a, b]
ed una sua parte γǫparametrizzata da
γǫ:tr(t), t [a, ǫ].
Vale
lim
ǫa+Zγǫ
f(r) ds= 0 .(8.4)
8.2. GLI INTEGRALI DI CURVA 227
Notiamo infine che se si divide un arco γ γ1eγ2,
γ:tr(t), t [a, c]
γ1:tr(t), t [a, b] ; γ2:tr(t), t [b, c] ;
allora vale Zγ
f(r) ds=Zγ1
f(r) ds+Zγ2
f(r) ds . (8.5)
Osservazione 221 La definizione di integrale di curva di prima specie `e stata data assu-
mendo che l’arco sia regolare. La (8.5) mostra come definire l’integrale nel caso di un arco
regolare a tratti: se l’arco γsi decompone” in (per esempio) due sottoarchi γ1eγ2regolari,
si sceglie la (8.5) come definizione di integrale su γ.
8.2.2 Integrali di curva di seconda specie
La definizione che ora andiamo a dare generalizza quella che si usa in fisica per il calcolo di
un lavoro.
Esempio 222 Supponiamo che in ogni punto rdello spazio agisca una forza F(r) =
F(x, y, z) = f(x, y, z)i+g(x, y, z)j+h(x, y, z)k. Un punto materiale di massa msia vincolato
a descrivere un arco r(t), t[a, b]. Il parametro trappresenta ora il tempo. Si vuol valutare
il lavoro compiuto dalla forza.
Dividendo ancora il percorso del punto in tanti “piccoli pezzetti”, interessa ora valutare
il prodotto scalare della forza agente su ciascun “pezzetto” per lo spostamento del punto.
Lo spostamento `e un vettore, a differenza della lunghezza percorsa che `e un numero.
Quando tvaria da tiati+1 lo spostamento `e circa r(ti)(ti+1 ti) e quindi il lavoro
compiuto `e circa
[F(r(ti)) ·r(ti) ](ti+1 ti).
La somma di tutti questi “lavori elementari” `e
N1
X
i=0
[F(r(ti)) ·r(ti)](ti+1 ti)
e, per calcolare il lavoro della forza bisogna studiare il comportamento di queste somme,
quando la finezza della suddivisione dell’intervallo [a, b] tende a zero. Si sa che in questo
modo si arriva a calcolare l’integrale su [a, b] della funzione
F(r(t)) ·r(t).
Seguendo il suggerimento dell’esempio precedente definiamo l’integrale di curva di seconda specie
come segue: si assegna un campo vettoriale V(r) e un arco γ, parametrizzato da r(t),
t[a, b]. Si definisce
Zγ
V(r)·dr=def Zb
a
V(r(t)) ·r(t) dt . (8.6)
228 CAPITOLO 8. INTEGRALI DI CURVA E DI SUPERFICIE
Nel caso particolare n= 3 e V(x, y, z) = f(x, y, z)i+g(x, y, z)j+h(x, y, z)ksi trova:
Zγ
V(r)·dr=Zb
a
[f(x(t), y(t), z(t))x(t)
+g(x(t), y(t), z(t))y(t) + h(x(t), y(t), z(t))z(t)] dt . (8.7)
Osservazione 223 Una curva semplice e chiusa si chiama anche un circuito e l’integrale
di un campo vettoriale V(r) lungo una curva chiusa si chiama anche la circuitazione del
campo vettoriale lungo γ. Quando la curva γ`e semplice e chiusa, l’integrale su γsi indica
anche col simbolo
Iγ
V(r)·dr.
E’ immediato verificare, usando la formula di cambiamento di variabili:
Teorema 224 Il valore dell’integrale di curva di seconda specie non muta cambiando pa-
rametrizzazione; cambia di segno cambiando verso di percorrenza.
La prima affermazione mostra che, per ogni fissato campo vettoriale V(R), l’integrale di
curva di seconda specie `e una propriet`a geometrica della curva. La seconda affermazione si
esprime scrivendo
Zγ
V(r)·dr=Zγ
V(r)·dr.
E’ ovvio inoltre che se si divide un arco γin due archi γ1eγ2,
γ:tr(t), t [a, c]
γ1:tr(t), t [a, b] ; γ2:tr(t), t [b, c] ;
allora vale
Zγ
V(r)·dr=Zγ1
V(r)·dr+Zγ2
V(r)·dr.(8.8)
Esattamente come nell’osservazione 221, la (8.8), pu`o usarsi per estendere la definizione di
integrale di curva di seconda specie ad archi regolari a tratti.
L’arco γottenuto percorrendo prima γ1e poi γ2si indica col simbolo γ1+γ2.Questo
simbolo non indica soltanto l’unione insiemistica dei sostegni perch´e per il calcolo dell’integrale
bisogna anche specificare il verso di percorrenza. Con questa notazione, la (8.8) si scrive
anche
Zγ1+γ2
V(r)·dr=Zγ1
V(r)·dr+Zγ2
V(r)·dr.
Quest’osservazione suggerisce la notazione seguente: siano γ1eγ2due archi, non necessaria-
mente “sottoarchi” del medesimo. Col simbolo γ1+γ2intendiamo di percorrere prima l’arco
γ1, preso col suo verso di percorrenza, e quindi l’arco γ2preso col suo verso di percorrenza.
8.2. GLI INTEGRALI DI CURVA 229
Col simbolo γ1γ2si intende di percorrere prima l’arco γ1, col suo verso di percorrenza, e
poi l’arco γ2col verso di percorrenza negativo. Definiamo quindi
Zγ1+γ2
V(r)·dr=Zγ1
V(r)·dr+Zγ2
V(r)·dr,
Zγ1γ2
V(r)·dr=Zγ1
V(r)·dr+Zγ2
V(r)·dr
=Zγ1
V(r)·drZγ2
V(r)·dr.
Consideriamo ora la figura 8.1. La figura a sinistra rappresenta due archi, γ1eγ2tali
che n´e γ1+γ2e γ1γ2rappresentano un arco. La figura a destra rappresenta due archi,
ciascuno col proprio verso di percorrenza, tali che γ1+γ2rappresenta un arco mentre γ1γ2
non rappresenta un arco.
Figura 8.1: “Operazioni” sugli archi
−3 −2 −1 0 1 2 3 4 5
−1.5
−1
−0.5
0
0.5
1
1.5
0 2 4 6 8 10 12 14
−1
0
1
2
3
4
5
6
7
8
γ1
γ2
La figura 8.2 rappresenta a sinistra l’arco γ1
γ1:x= (1 t)2, y = (1 t)3, t [0,1] (8.9)
e, nel medesimo piano, l’arco γ2:
γ2:x=t , y =t , t [1,2] (8.10)
ciascuno con indicato il verso di percorrenza. E’ chiaro che γ1+γ2non `e un arco, mentre
γ1γ2lo `e. La figura a destra rappresenta un caso tipico, che useremo pi`u volte. Si noti
che la curva “esterna e la curva “interna” sono percorse in verso opposto.
Per gli integrali di curva di seconda specie pu`o darsi un risultato analogo alla (8.4).
Usando le medesime notazioni, si ha:
lim
ǫa+Zγǫ
V(r)·dr= 0 ,(8.11)
230 CAPITOLO 8. INTEGRALI DI CURVA E DI SUPERFICIE
Figura 8.2: Gli archi (8.9) e (8.10) a sinistra. A destra una regione delimitata
da due archi
0 0.2 0.4 0.6 0.8 1 1.2 1.4 1.6 1.8 2
0
0.2
0.4
0.6
0.8
1
1.2
1.4
1.6
1.8
2
−4 −3 −2 −1 0 1 2 3 4
−4
−3
−2
−1
0
1
2
3
4
fatto che si prova facilmente introducendo la parametrizzazione dell’arco1. Ricordando per`o
che l’integrale di curva di seconda specie cambia segno cambiando il verso di percorrenza,
si possono enunciare due risultati che non hanno analogo per gli integrali di curva di prima
specie.
Supponiamo che un arco ripassi due volte su un arco γ1, percorrendolo in versi oppo-
sti. Allora, nel calcolo dell’integrale γ1non d`a contributo. In particolare, si consideri la
figura 8.3. Nella figura, i due lati affiancati vanno pensati sovrapposti e sono il sostegno
dell’arco γ1. Sono stati disegnati soltanto affiancati per chiarezza.
Figura 8.3: Archi che “si elidono”
−1 −0.8 −0.6 −0.4 −0.2 0 0.2 0.4 0.6 0.8 1
−1
−0.8
−0.6
−0.4
−0.2
0
0.2
0.4
0.6
0.8
1
1come diremo al paragrafo 8.2.3, questa propriet`a immediatamente discende dalla (8.4).
8.2. GLI INTEGRALI DI CURVA 231
Indichiamo con γsla curva il cui sostegno `e il quadrato di sinistra e con γdquella il cui
sostegno `e il quadrato di destra. Nella somma
Zγs
V(r)·dr+Zγd
V(r)·dr
il contributo di γ1si elide e si trova
Zγs+γd
V(r)·dr=Zγs
V(r)·dr+Zγd
V(r)·dr=Zγ
V(r)·dr(8.12)
ove γ`e la curva il cui sostegno `e il rettangolo che si ottiene sopprimendo il lato comune ai
due quadrati, col verso di percorrenza indicato.
Naturalmente nelle considerazioni precedenti il fatto che le curve siano ottenute per
mezzo di segmenti rettilinei non ha alcuna importanza.
Una seconda osservazione, semplice ma importante, `e la seguente: siano γ0eγτ(τ`e un
parametro) due segmenti
γ:r=r0+tu0, t [0, a]γτ:r=r+tu, t [0, b].
Supponiamo che
||u0|| = 1 ,||u|| = 1 .
e consideriamo i due integrali
Zγ
V(r)·dr,Zγτ
V(r)·dr.
Supponiamo che il campo vettoriale sia continuo e che “il segmento γτtenda a sovrapporsi a
γ0”. Questo vuol dire che il secondo segmento dipende da un parametro, diciamo τ[0,1],
ossia che
r=r(τ),u=u(τ), b =b(τ).
Assumiamo che queste funzioni dipendano da τin modo continuo e che sia
r(0) = r0,u(0) = u0, b(0) = a .
In tal caso:
Teorema 225 Si ha:
lim
τ0Zγτ
V(r)·dr=Zγ0
V(r)·dr.
La dimostrazione `e ovvia. Infatti,
Φ(t, τ) = [V(r(τ) + tu(τ))] ·u(τ)
`e una funzione continua delle due variabili teτe inoltre
Φ(t, 0) = V(r0+tu0)·u0.
Dunque,
lim
τ0Zγτ
V(r)·dr= lim
τ0Zb(τ)
0
Φ(t, τ) dt=Za
0
Φ(t, 0) d1 = Zγ
V(r)·r,
232 CAPITOLO 8. INTEGRALI DI CURVA E DI SUPERFICIE
si veda il paragrafo 4.2.4.
In particolare,
lim
τ0Zγτ
V(r)·dr=Zγ0
V(r)·dr.
Dunque,
Corollario 226 Nelle ipotesi dette sopra si ha
lim
τ0Zγτ
V(r)·dr+Zγ0
V(r)·dr= 0 .
Ossia, Il contributo dei due integrali tende ad elidersi. Questo `e il corollario che useremo pi`u
avanti. Ora, usiamo sia la (8.11) che il Corollario 226 per giustificare l’uso della notazione
Zγ1+γ2
anche nel caso in cui γ1+γ2non `e un arco. Torniamo a considerare la figure 8.1 a sinistra.
Si confronti questa figura con la figura 8.4, a sinistra. La figura di sinistra rappresenta
Figura 8.4: Integrali di curva di seconda specie ed archi che si elidono”
−3 −2 −1 0 1 2 3 4 5
−1.5
−1
−0.5
0
0.5
1
1.5
S1
S2
A1,ε A2,ε
−4 −3 −2 −1 0 1 2 3 4
−4
−3
−2
−1
0
1
2
3
4
una curva semplice e chiusa, chiamiamola γǫ, dipendente dal parametro ǫ, lunghezza degli
archi (indicati con A1,A2) rimossi” dalle ellissi di destra e di sinistra, che chiamiamo
rispettivamente γ1eγ2. Dunque,
Zγǫ
V(r)·drZγ1+γ2
V(r)·dr
=ZS1
V(r)·dr+ZS2
V(r)·dr
ZA1
V(r)·drZA2
V(r)·dr.
8.2. GLI INTEGRALI DI CURVA 233
Facendo tendere ǫa zero, l’integrale sugli archi A1,A2 tende a zero per la (8.11), mentre
la somma degli integrali sui due segmenti tende a zero per il Corollario 226. Dunque,
lim
ǫ0Zγǫ
V(r)·dr=Zγ1+γ2
V(r)·dr.
Ci`o spega perch´e `e necessario considerare espressioni del tipo
Zγ1+γ2
anche nel caso in cui γ1+γ2non `e un arco.
La figura 8.4, a destra, mostra una spiegazione analoga nel caso illustrato nella figura 8.1,
a destra.
Osservazione 227 Si noti che in ambedue gli esempi, gli archi i cui integrali approssimano
quello su γ1+γ2sono semplici. Fissato il verso di percorrenza su γ1, quello su γ2viene
automaticamente determinato se si vuol avere un’approssimazione con un arco semplice.
In particolare, nel caso delle due curve di Jordan, una nella regione interna dell’altra, usa
prendere la curva pi`u esterna orientata positivamente e quindi quella pi`u interna orientata
negativamente. Pi`u avanti vedremo la ragione di tale scelta.
Infine, supponiamo di avere due curve γ1eγ2, non necessariamente semplici:
γ1:tr(t)t[a, b] ; γ2:τρ(τ)τ[α, β].
Diciamo che le due curve hanno gli stessi estremi quando
r(a) = ρ(α),r(b) = ρ(β).
In questa definizione si `e tenuto conto del verso di percorrenza delle curve: i due “primi
estremi” devono coincidere ed i due secondi estremi” devono coincidere. In tal caso:
Lemma 228 Nelle ipotesi dette sopra, γ1γ2`e una curva chiusa e
Zγ1γ2
V(r)·dr=Zγ1
V(r)·drZγ2
V(r)·dr.
8.2.3 Integrali di curva di prima e di seconda specie
E’ interessante confrontare le definizioni degli integrali di curva di prima e seconda specie
nel caso particolare in cui V(r) = f(r)i. In questo caso
Zγ
V(r)·dr=Zb
a
f(x(t), y(t), z(t))x(t) dt
mentre
Zγ
fds=Zb
a
f(x(t), y(t), z(t))p[x(t)]2+ [y(t)]2+ [z(t)]2dt .
234 CAPITOLO 8. INTEGRALI DI CURVA E DI SUPERFICIE
Questi due integrali non si riconducono l’uno all’altro nemmeno nel caso in cui y(t) e z(t)
sono identicamente zero. Infatti, in tal caso essi vengono ad essere, rispettivamente,
Zb
a
f(x(t), y(t), z(t)) x(t) dt , Zb
a
f(x(t), y(t), z(t))|x(t)|dt .
Ci`o nonostante, esiste una relazione tra gli integrali di prima e seconda specie, che ora
mostriamo.
Consideriamo l’arco
γ:x(t)i+y(t)j+z(t)k, t [a, b]
Ricordiamo che con t(r) si `e indicato il versore tangente alla curva nel punto r:
t(r(t)) = t(t)
|r(t)|=x(t)
p[x(t)]2+ [y(t)]2+ [z(t)]2i
+y(t)
p[x(t)]2+ [y(t)]2+ [z(t)]2j+z(t)
p[x(t)]2+ [y(t)]2+ [z(t)]2k
Sia
V(r) = V1(r)i+V2(r)j+V(r)k
un campo vettoriale definito sulla curva γ. Introduciamo la funzione
f(t) = V(r(t)) ·(x(t)
p[x(t)]2+ [y(t)]2+ [z(t)]2i
+y(t)
p[x(t)]2+ [y(t)]2+ [z(t)]2j+z(t)
p[x(t)]2+ [y(t)]2+ [z(t)]2k).
Si ha Zγ
V(r)·dr=Zγ
f(r) ds . (8.13)
Talvolta questa formula si trova scritta in modo diverso. Notiamo che
n1=x(t)
p[x(t)]2+ [y(t)]2+ [z(t)]2
n2=y(t)
p[x(t)]2+ [y(t)]2+ [z(t)]2
n3=z(t)
p[x(t)]2+ [y(t)]2+ [z(t)]2
sono i coseni direttori della tangente t(r(t)). Per questo la formula (8.13) si trova anche
scritta come segue:
Zγ
V(r)·dr=Zγ
[V1n1+V2n2+V3n3] ds .
Notiamo infine che la (8.11) si pu`o derivare dalla (8.4), usando la (8.13).
8.2. GLI INTEGRALI DI CURVA 235
8.2.4 Integrali di curva di seconda specie e forme diffe-
renziali
L’integrale di curva di seconda specie si calcola quando `e dato un campo vettoriale V(r).
Dunque, possiamo vedere il campo vettoriale come operante sulla curva γ: il campo vet-
toriale V(r) associa un numero alla curva γ. Vedremo che altri campi vettoriali si usano
per associare numeri alle superfici. Dunque conviene distinguere i due casi, introducendo
termini e notazioni diverse. Nel caso che stiamo considerando, il campo vettoriale agisce su
una curva. Invece di indicarlo col simbolo V(x, y, z) = f(x, y, z)i+g(x, y, z)j+h(x, y, z)k,
indichiamolo col simbolo2
f(x, y, z) dx+g(x, y, z) dy+h(x, y, z) dz . (8.14)
Non vogliamo dare nessun significato particolare ai simboli dx, dye dz. Essi, come si `e
notato, sono suggeriti dalla formula (8.7). Ricordiamo per`o che nel caso dell’integrale su
un intervallo, si conserva la notazione dx perch´e questa aiuta a ricordare certe formule.
Come vedremo, qualcosa di analogo accade anche in questo caso.
La (8.14) si chiama 1–forma differenziale (il numero 1 ricorda che si agisce su una cur-
va, un oggetto che, intuitivamente3, ha dimensione 1, come un segmento o un filo). L’integra-
le di curva di seconda specie si chiama anche l’integrale di curva della 1–forma differenziale
e si indica anche col simbolo Zγ
fdx+gdy+hdz
(sottintendendo la dipendenza di f,gehda x,yez).
Una regola mnemonica per ottenere la formula (8.7), per esempio nel caso n= 3 `e la
seguente: si ricordi che le funzioni f,ged hdipendono da (x, y, z). Allora, si sostituisca x
con x(t), ycon y(t), zcon z(t) ovunque queste lettere compaiono; e si interpreti d come
segno di derivata; e quindi dxsi sostituisce con x(t) dt, dycon y(t) dte dzcon z(t) dt.
Infine, si integri da afino a b, ottenendo la (8.7).
Questa `e una prima buona ragione per usare la notazione delle forme differenziali. Pi`u
avanti ne vedremo altre.
Una forma differenziale si indica spesso con una lettera greca minuscola tratta dalla fine
dell’alfabeto, come ω,
ω=fdx+gdy+hdz .
Con tale notazione l’integrale della forma differenziale si indica
Zγ
ω .
Infine, diciamo che la forma differenziale
ω=fdx+gdy+hdz
2suggerito dalla formula (8.7).
3e solo sotto condizioni di regolarit`a: esistono curve dalla parametrizzazione continua
ma non derivabile, che hanno per sostegno un quadrato. Il prototipo di tali curve si chiama
“curva di Peano”.
236 CAPITOLO 8. INTEGRALI DI CURVA E DI SUPERFICIE
`e di classe C1quando sono di classe C1i suoi coefficienti , ossia le funzioni f(x, y, z),
g(x, y, z), e h(x, y, z).
Osservazione 229 Si noti che il simbolo dx`e una forma differenziale: quella di coefficienti
f= 1 e g=h= 0. Questa forma differenziale si chiama anche il differenziale della variabile
x. Questo termine differenziale” ha un significato diverso da quello introdotto al Cap. 4.
Esistono relazioni tra questi due diversi concetti, che per`o non illustriamo.
8.2.5 Il flusso
Sia
V(x, y) = f(x, y)i+g(x, y)j+h(x, y)k
un campo vettoriale che ad ogni punto del piano z= 0 associa un vettore di R3. Sia
Dun dominio di integrazione e supponiamo che V(x, y) sia continuo sulla chiusura di D.
Possiamo pensare che il piano z= 0 sia immerso in un fluido che scorre in modo che
quando una particella si trova nel punto (x, y, 0) ivi abbia la velocit`a V(x, y)e mantenga tale
velocit`a dopo che ha lasciato il piano z= 0.Il flusso attraverso D`e la quantit`a di fluido che
traversa Dnell’unit`a di tempo. Per calcolarla4procediamo in questo modo. Approssimiamo
Dmediante un numero finito di rettangoli Ri, come nella definizione dell’integrale doppio.
Una particella che si trova in un punto (x, y, 0) Ridescrive nell’unit`a di tempo il segmento
rettilineo che congiunge (x, y, 0) con V(x, y). Infatti, abbiamo detto che la velocit`a non
cambia dopo che la particella ha lasciato il piano z= 0. Dunque, nell’unit`a di tempo le
particelle che escono dal rettangolo Ririempiono una specie di parallelepipedo, con “faccia
superiore” non piana, di base Ri. L’altezza varia da punto a punto, come in figura 8.5, a
sinistra. Se il rettangolo `e “piccolo” l’altezza sar`a circa uguale a k·V(xi, yi) ove (xi, yi)
Figura 8.5: Il flusso
−0.5
0
0.5
−0.4
−0.3
−0.2
−0.1
0
0.1
0.2
0.3
0
0.02
0.04
0.06
0.08
0.1
0.12
0.14
0.16
0.18
Ri
V(xi,yi)
h
−1 −0.5 0 0.5 1 1.5
0
0.2
0.4
0.6
0.8
1
1.2
1.4
1.6
1.8
2
ri+1
ri
n( ri)
V( ri)
`e per esempio il vertice in basso a sinistra del rettangolo Ri. Dunque il volume di questo
4pi`u correttamente dovremmmo dire “per definirla”.
8.2. GLI INTEGRALI DI CURVA 237
solido `e approssimato da
h(Area di Ri) = [k·V(xi, yi)](Area di Ri).
Si noti che l’area di Ri`e positiva mentre l’altezza pu`o anche essere negativa; ossia, il volume
si prende “con segno perch´e non `e indifferente che il fluido scorra verso l’alto o verso il
basso.
Sommiamo ora i contributi di tutti i singoli rettangoli. Si trova una somma integrale di
quelle che definiscono l’integrale
ZD
V(x, y)·kdxdy .
Scegliamo quindi questa formula come definizione di usso attraverso il dominio di inte-
grazione D.
Pi`u avanti vedremo la definizione di flusso attraverso una superficie non piana. Ora,
definiamo il flusso di un campo piano attraverso una curva.
Supponiamo che uno strato liquido riempia il piano (x, y) e che il campo vettoriale
V(x, y) = f(x, y)i+g(x, y)j
rappresenti la velocit`a con cui una particella traversa la posizione (x, y). Sia γun arco
regolare, parametrizzata da
γ:x=x(t), y =y(t), t [a, b].
Si chiama flusso del campo Vattraverso la curva γla quantit`a di fluido che nell’unit`a
di tempo traversa la curva. Per calcolarlo, dividiamo la curva in archi γimediante i punti
ri. Supponiamo per semplicit`a che questi archi abbiano tutti la medesima lunghezza l.
Supponiamo che la particella che traversa il punto (x, y)γmantenga la velocit`a V(x, y)
anche dopo aver traversato la curva. Se gli archi sono “molto piccoli”, la velocit`a delle
singole particelle di liquido che traversano l’arco γisi potr`a approssimare mediante V(xi, yi).
Nell’unit`a di tempo, queste particelle di liquido riempiono una parte di piano che all’incirca
`e un parallelogramma la cui base misura le la cui altezza misura [V(xi, yi)·n(xi, yi)] ove
n(xi, yi) `e la normale a γnel punto ri, si veda la figura 8.5, a destra. La somma
X
i
[V(xi, yi)·n(xi, yi)]l
`e una somma integrale che per l0 approssima
Zγ
[V(r)·n(r)] ds .
Si sceglie quindi quest’integrale come definizione di flusso di un campo vettoriale attraverso
una curva.
Il usso cambia segno cambiando il verso di percorrenza lungo la curva perch´e cambiando
verso di percorrenza cambia il verso sulla normale.
Supponiamo ora che la curva γsia semplice e chiusa. In questo caso, usa privilegiare la
normale esterna ne:
ne=1
p[x(t)]2+ [y(t)]2[y(t)ix(t)j]
238 CAPITOLO 8. INTEGRALI DI CURVA E DI SUPERFICIE
e quindi il flusso uscente dalla regione γdelimitata da γ`e
Zb
a
[f(x(t), y(t))y(t)g(x(t), y(y))x(t)] dt=Zγgdx+fdy .
8.3 Analisi vettoriale nel piano
Mostriamo che calcolare l’integrale di certi campi vettoriali equivale al calcolo di integrali
multipli. Questo studio va sotto il nome di analisi vettoriale.
8.3.1 Una considerazione preliminare
Consideriamo una funzione
y=f(x), x [a, b].
Questa funzione identifica la curva semplice
γf:x=t , y =f(t), t [a, b].
Sia ora F(x, y) una funzione (continua) delle due variabili xed ye consideriamo l’integrale
Zb
a
F(x, f(x)) dx .
Questo `e l’integrale
Zγf
V(r)·dr
ove
V(r) = V(x, y) = F(x, y)i+ 0j.
Col linguaggio delle forme differenziali,
Zb
a
F(x, y(x)) dx=Zγf
Fdx .
Infatti, x(t) = 1. Analogamente, se
x=h(y), y [α, β],
sia γhla curva identificata da questo grafico. Si ha
Zβ
α
F(h(y), y) dy=Zγh
W·dr
ove ora W= 0i+F(x, y)j.
E’ importante esaminare la figura 8.6 e rendersi conto dei versi di percorrenza scelti su
queste curve.
8.3. ANALISI VETTORIALE NEL PIANO 239
Figura 8.6: Versi di percorrenza
−0.5 0 0.5 1 1.5 2 2.5 3 3.5 4 4.5
−0.5
0
0.5
1
1.5
2
2.5
3
3.5
f(x)
h(y)
x
y
a b
α
β
8.3.2 Formula di Green
Siano ora γfeγgdue curve cartesiane definite sul medesimo intervallo,
y=f(x)x[a, b]
e
y=g(x)x[a, b].
Supponiamo inoltre che per ogni x(a, b) sia5
g(x)> f(x).
Indichiamo con la regione delimitata dai due grafici e dai segmenti verticali per x=a
e per x=bcongiungenti i due grafici. Il segmento si considera nel caso in cui l’uguaglianza
non valga in uno dei due estremi. Si veda la figura 8.7, a sinistra.
Si noti che la frontiera di `e sostegno di una curva chiusa. Ricordando le nostre
convenzioni, indicheremo col medesimo simbolo sia la curva che il suo sostegno; e quindi
la indicheremo col simbolo e, sempre per le nostre convenzioni, `e orientata in senso
antiorario.
Vogliamo calcolare
Z
Fy(x, y) dxdy .
5Non si esclude che l’uguaglianza valga negli estremi dell’intervallo.
240 CAPITOLO 8. INTEGRALI DI CURVA E DI SUPERFICIE
Figura 8.7: Formula di Green
−0.5 0 0.5 1 1.5 2 2.5 3 3.5
−2
−1
0
1
2
3
4
g(x)
f(x)
−0.5 0 0.5 1 1.5 2 2.5 3 3.5
−2
−1
0
1
2
3
4
x
y
α
β
φ
φ
ψ
ψ
Quest’integrale si calcola come segue:
Zb
a"Zg(x)
f(x)
Fy(x, y) dy#dx=Zb
a
[F(x, g(x)) F(x, f(x))] dx=Zγg
VdrZγf
Vdr
ove
V(x, y) = F(x, y)i+ 0j.
Guardando i versi di percorrenza, si vede che
Z
Fy(x, y) dx=Z
[V]·dr.(8.15)
Si noti che in questo calcolo il segmento verticale d`a contributo nullo.
Sia ora G(x, y) una funzione derivabile. Si vuol calcolare
Z
Gx(x, y) dxdy .
Proiettando la regione sull’asse delle ordinate si trova un segmento [α, β]. La frontiera
di `e ancora grafico di due funzioni, la funzione φ(x) e la funzione ψ(x), si veda la figu-
ra 8.7, a destra. I pallini con la freccia servono ad indicare i punti nei quali i due grafici si
congiungono. Il grafico di ψ(x) include il segmento verticale.
Calcoliamo
Z
Gx(x, y) dxdy=Zβ
α"Zψ(y)
φ(y)
Gx(x, y) dx#dy
=Zβ
α
[G(ψ(y), y)G(φ(y), y)] dy(8.16)
=Zγψ
W·drZγφ
W·dr=Z
Wdr(8.17)
8.3. ANALISI VETTORIALE NEL PIANO 241
con
W(x, y) = 0i+G(x, y)j.
Si noti che in questo calcolo il segmento verticale d`a contributo non nullo, mentre darebbe
contributo nullo un eventuale segmento orizzontale sulla frontiera di Ω.
Combinando i due calcoli precedenti si trovano le due formule seguenti:
Z
[Gx(x, y)Fy(x, y)] dxdy=Z
[Fdx+Gdy],(8.18)
ottenuta sottraendo la (8.15) con la (8.17).
Sommandole si trova invece
Z
[Gx(x, y) + Fy(x, y)] dxdy=Z
[Fdx+Gdy].(8.19)
Osservazione importante
Le formule (8.18) e (8.19) valgono anche se la regione con cui si lavora `e delimitata
da pi`u di due grafici e pi`u in generale essa vale per qualsiasi regione di Jordan γ, deli-
mitata da una curva γregolare a tratti. Quindi non c’`e pi`u ragione di fare intervenire
i trapezoidi delle funzioni f(x) e g(x), e quindi di indicare con lettere maiuscole le
funzioni da integrare. Per questo, da ora in poi useremo la notazione pi`u usuale
Z
[gx(x, y)fy(x, y)] dxdy=Z
[fdx+gdy],
Z
[gx(x, y) + fy(x, y)] dxdy=Z
[fdx+gdy],
con le lettere minuscole.
Le due formule precedenti sono tra loro equivalenti (si passa dall’una all’altra cam-
biando fin f). Hanno per`o due diversi significati fisici, e per questo `e bene
conservarle ambedue. Inoltre, ambedue la formula hanno un equivalente nello spa-
zio R3, ma in tal caso le due formule che si ottengono non possono ridursi l’una
all’altra con una semplice trasformazione.
La formula
Z
[gx(x, y)fy(x, y)] dxdy=Z
fdx+gdy . (8.20)
si chiama formula di Green .
Osservazione 230 Si noti che [gx(x, y)fy(x, y)] `e la componente lungo il versore kdel
rotore del campo vettoriale V(x, y) = f(x, y)i+g(x, y)j+ 0k. La formula (8.20) si scrive
quindi come
Z
(rot V)·kdxdy=Z
V·dr=Z
fdx+gdy . (8.21)
242 CAPITOLO 8. INTEGRALI DI CURVA E DI SUPERFICIE
Col linguaggio dei campi vettoriali la formula si interpreta come segue: il flusso del
rotore del campo vettoriale V(x, y)attraverso la superficie piana `e uguale alla circuitazione
del campo vettoriale stesso lungo .Naturalmente si sottintende che sia positivamente
orientata.
Osservazione 231 Torniamo a considerare la formula
Z
[gx(x, y) + fy(x, y)] dxdy=Z
[fdx+gdy].(8.22)
Quest’uguaglianza si chiama Teorema della divergenza nel piano . Come si `e detto, essa
`e una diversa formulazione della formula di Green. Come tale, esso sotto le medesime
condizioni, ma ha una diversa interpretazione fisica, che ora illustriamo.
Consideriamo il campo vettoriale
W(x, y) = g(x, y)i+f(x, y)j.
A destra della (8.22) figura il flusso del campo vettoriale W,uscente dalla regione (regione
interna alla curva regolare a tratti Ω). A sinistra figura la divergenza di W. Dunque
la (8.22) si scrive anche come
Z
div W(x, y) dxdy=Z · W(x, y) dxdy=Z
W·neds . (8.23)
Essa si interpretra come segue: il flusso uscente da γdel campo vettoriale W`e uguale
all’integrale su della divergenza di W.
Quest’interpretazione in particolare spiega l’uso del termine divergenza”.
8.3.3 Formula di Green e forme differenziali
Si `e detto che il simbolo d” si conserva dentro il simbolo di integrale perch´e aiuta a ricordare
le formule. In apparenza ci`o non accade per la formula di Green. E’ per`o possibile introdurre
dei simboli comodi come segue. Se f(x, y) `e una funzione, con df(x, y) indichiamo la forma
differenziale
df(x, y) = fx(x, y) dx+fy(x, y) dy .
Se ω`e una 1–forma differenziale, definiamo
dω= d {fdx+gdy}=fxdxdx+fydydx+gxdxdy+gydydy .
Ora introduciamo le regole seguenti:
dxdx= 0 ,dydy= 0 ,dydx=dxdy , (8.24)
8.3. ANALISI VETTORIALE NEL PIANO 243
suggerite dalle regole con le quali si calcola il prodotto vettoriale, (esplicitamente usato nella
formula (8.21)):
ii= 0 ,jj= 0 ,ji=ij.
In questo modo si trova
dω= [fy+gx] dxdy(8.25)
e questo `e proprio l’integrando dell’integrale doppia in (8.20). Dunque, un modo per
ricordare la (8.20) `e di scriverla come
Z
ω=Z
[fdx+gdy] = Z
d[fdx+gdy] = Z
dω . (8.26)
Osservazione 232 Introdurremo pi`u avanti il Teorema di Stokes in R3, che vale per curve
che sono bordo di calotte. Il Teorema di Green `e il caso particolare del Teorema di Stokes in
R3che si ottiene quando la curva `e una curva di Jordan e quando la superficie `e la regione
interna alla curva.
La 2-forma differenziale dωsi chiama anche il differenziale esterno (o pi`u brevemente
il differenziale) della 1-forma ω.
8.3.4 Le forme differenziali e le aree piane
Scriviamo la formula di Green scegliendo come forma differenziale la seguente:
ω=ydx+xdy
Si trova Zγydx+xdy=Zγ
2 dxdy
e l’integrale a destra `e il doppio dell’area di γ. Si trova quindi:
Teorema 233 Sia γuna curva di Jordan orientata positivamente e sia γla sua regione
interna. L’area di γ`e data da
1
2Zγydx+xdy .
Questa formula `e un caso particolare del Teorema di Green e quindi si prova calcolando
Zγ
1 dxdy
mediante successive integrazioni per parti. E’ per`o interessante vedere un’argomento geo-
metrico che conduce a questa formula.
Sia γ:tr(t), t[a, b] un arco piano regolare, semplice e chiuso e sia γla sua
regione interna.
Per semplicit`a di esposizione, assumiamo che l’origine degli assi appartenga alla regione
interna γ(caso a cui ci si pu`o sempre ricondurre mediante una traslazione).
244 CAPITOLO 8. INTEGRALI DI CURVA E DI SUPERFICIE
Figura 8.8: Area di una regione di Jordan
−6 −4 −2 0 2 4 6
−6
−4
−2
0
2
4
6
−1.5 −1 −0.5 0 0.5 1 1.5 2
−1.5
−1
−0.5
0
0.5
1
1.5
2
r1
t1
r2
t2
r3
t3
r4
t4
T1 T2
T3
T4
Si consideri la figura 8.8. Il punto r(t) varia sull’arco. Dividiamo l’intervallo [a, b] in
“piccoli” intervalli, dividendolo con i punti ti(equidistanti per semplicit`a). Approssimiamo
l’arco r(t), t[ti, ti+1] col segmento di tangente
r=r(ti) + r(ti)(tti), t [ti, ti+1]
come in figura 8.8. Consideriamo i triangoli di vertici l’origine, il punto r(ti) e il secondo
estremo del segmento di tangente. Si potrebbe provare che quando la finezza della partizione
di [a, b] tende a zero, la somma delle aree di questi triangoli tende all’area di γ, pur di
intendere l’area di tali triangoli con segno, in modo da cancellare eventuali parti di area
coperte pi`u volte.
L’area (con segno) di ciascuno di questi triangoli `e la met`a della componente lungo l’asse
zdel prodotto vettoriale dei vettori r(ti) e r(ti)(ti+1 ti). Per approssimare l’area di γ
dobbiamo quindi sommare la componenti lungo l’asse verticale di
1
2r(ti)r(ti)(ti+1 ti).
Si trova cos`ı
1
2
N1
X
i=0
[x(ti)y(ti)y(ti)x(ti)](ti+1 ti).
Al tendere a zero della finezza della partizione queste somme approssimano
1
2Zb
a
[x(t)y(t)y(t)x(t)] dt=1
2Zγ
[ydx+xdy].(8.27)
L’argomento precedente non `e rigoroso, ma pu`o pienamente giustificarsi.
Chiediamoci ora se l’integrale precedente restituisce l’area di γ, oppure l’area col segno
negativo. Si vede subito dalla figura 8.8 che la somma delle aree dei triangoli viene positiva
quando l’orientazione della curva `e concorde con quella di R2;ossia quando la curva `e orientata
positivamente.
8.3. ANALISI VETTORIALE NEL PIANO 245
8.3.5 Le estensioni
La formula di Green `e stata provata per una regione molto particolare. Si `e gi`a notato che
essa vale sotto condizioni molti pi`u generali. E infatti:
Teorema 234 Le uguaglianze (8.21) e (8.19) valgono per ogni regione γ, con γcurva
regolare a tratti e per ogni coppia di funzioni f(x, y),g(x, y)di classe C1(Ωγ), continue
sulla chiusura di γ.
Mostriamo ora un’estensione importante di queste formule. Quest’estensione `e suggerita
dalla figura (8.4).
Si tratta di un’estensione di queste formule a regioni delimitate da pi`u curve, come nel
caso rappresentato dalla figura 8.9, a sinistra, dove le curve sono due, γ1eγ2, il sostegno
dell’una contenuto nella regione interna all’altra.
Figura 8.9: Estensione della formula di Green
−6 −4 −2 0 2 4 6
−6
−4
−2
0
2
4
6
−6 −4 −2 0 2 4 6
−6
−4
−2
0
2
4
6
Chiamiamo la regione delimitata dalle curve γ1eγ2e sia V(x, y)C1(Ω) un campo
vettoriale continuo sulla chiusura di Ω.
Introduciamo due segmenti, S1ed S2, come nella figura a destra, e due piccoli tagli
uno su γ1e l’altro su γ2, in corrispondenza a tali segmenti. Si ottiene in questo modo una
curva ˜γche verifica sia le condizioni della formula di Green che quelle della formula della
divergenza. Vale quindi
Z˜γ
[gx(x, y)fy(x, y)] dxdy=Z˜γ
fdx+gdy ,
Z˜γ
[gx(x, y) + fy(x, y)] dxdy=Z˜γ
V·neds .
Quando S1ed S2tendono l’uno all’altro gli integrali lungo i due segmenti si elidono, gli
integrali sui due tagli tendono a zero (si ricordino la (8.11) e il Teorema 226.) e l’integrale
sulla regione interna a ˜γtende all’integrale su Ω. Si trova quindi
246 CAPITOLO 8. INTEGRALI DI CURVA E DI SUPERFICIE
Z
(rot V)·kdxdy=Zγ2
V·drZγ1
V·dr,
Z
div Vdxdy=Zγ2
V·nedsZγ1
V·neds .
Si noti che il segno negativo viene perch`e la curva interna va considerata orientata
negativamente, mentre abbiamo convenuto che nel simbolo Rγla curva chiusa debba essere
orientata positivamente.
Nel caso particolare in cui si abbia
div V(r) = · V(r) = 0 ,
La formula precedente mostra che Se la divergenza di un campo vettoriale `e nulla, il flusso del
campo vettoriale entrante attraverso γ1`e uguale a quello uscente attraverso γ2.
Si discutano risultati analoghi ai precedenti, nel caso in cui la regione delimitata dalla
curva pi`u esterna contenga vari “buchi”, ciascuno delimitato da una curva di Jordan regolare
a tratti.
Osservazione 235 Si osservi che se il campo vettoriale `e di classe C1(Ωγ1) allora le relazioni
precedenti si ottengono semplicemente per differenza:
Z · V(r)·dxdy=Zγ1 · V(r)·dxdyZγ2 · V(r)·dxdy
=Zγ1
W·nedsZγ2
W·˜
neds.
In questa formula, ˜
ne`e la normale esterna ad γ2e quindi interna ad Ω; e γ2`e percorsa in
senso positivo ripetto a γ2e quindi in senso negativo rispetto a Ω.
8.4 Integrali di superficie
La lunghezza di un arco `e stata definita nel paragrafo 6.1.2. Invece, non si `e definita l’area
di una calotta. Questo `e il primo argomento che ora studiamo. Definiremo poi l’integrale
su una calotta. Come nel caso delle curve, vedremo che serve definire due tipi diversi di
integrali.
8.4.1 Area di una calotta
Consideriamo una calotta r(u, v) con (u, v) variabili in una regione γdelimitata da una
curva semplice chiusa γ, regolare a tratti. Sia inoltre r(u, v) di classe C1(Ωγ).
Ricordiamo che la chiusura di γ`e un dominio di integrazione. Dunque, `e possibile
approssimare la regione γmediante tanti piccoli rettangoli con i lati paralleli agli assi
coordinati, si vedano l’osservazione 204 e il paragrafo 7.1.3. Fissiamo l’attenzione su uno di
questi rettangoli e sulla sua immagine sulla superficie (si veda la figura 8.10).
8.4. INTEGRALI DI SUPERFICIE 247
Figura 8.10: Area di una calotta
−1
−0.5
0
0.5
1−1 −0.5 00.5 1
0
0.5
1
1.5
2
2.5
3
3.5
4
Per semplicit`a di notazioni, supponiamo che esso sia un quadrato col vertice a sinistra
in basso nel punto (0,0) e che al punto (0,0) corrisponda il punto (0,0,0) (si noti che questo
non `e il caso illustrato dalla figura).
Consideriamo il lato (t, 0) del quadrato, 0 tτ. Ad esso corrisponde una curva r(t, 0)
sulla superficie, la cui tangente in (0,0,0) `e parallela al vettore ru(0,0). Consideriamo il
segmento di tangente ru(0,0)t, 0 tτ.
In modo analogo, a partire dall’altro lato di vertice (0,0), arriviamo a considerare il seg-
mento rv(0,0)t, 0 tτ. Questi due segmenti (uscenti da (0,0,0)) appartengono al piano
tangente e in generale non stanno sulla superficie; ma, se τ`e “piccolo il parallelogram-
ma che essi individuano differisce “per poco” dall’immagine del quadrato sulla superficie.
Dunque l’area di tale parallelogramma approssima l’area della parte di superficie che viene
descritta quando (u, v) varia nel quadrato.
L’area del parallelogramma `e τ2· |ru(0,0) rv(0,0)|=τ2|N(0,0)|.
Si ripeta questo argomento per ciascuno dei rettangoli e si sommino i risultati. Quello
che si trova `e una somma di Riemann per l’integrale doppio la funzione |N(u, v)|. Ci`o
giustifica la definizione seguente:
Definitione 4 Sia
(u, v)r(u, v) (u, v)
una superficie regolare. Sia γuna curva semplice e chiusa con sostegno in e sia
Σ : (u, v)r(u, v) (u, v)γ
la calotta corrispondente.
248 CAPITOLO 8. INTEGRALI DI CURVA E DI SUPERFICIE
Si chiama area della calotta Σ il numero
Zγ|N(u, v)|dudv .
Usando la regola per il cambiamento di coordinate degli integrali doppi e il Teorema 202 si
potrebbe provare:
Teorema 236 Due superfici equivalenti, ossia che differiscono solo per la parametrizza-
zione, hanno la medesima area. Inoltre, l’area non muta cambiando l’orientazione della
superficie.
Se la superficie `e data in forma cartesiana,
z=f(x, y),
la sua area `e
Zγq1 + f2
x(x, y) + f2
y(x, y) dxdy .
Come ulteriore caso particolare, consideriamo il caso di una superficie di rotazione,
descritta da
z=f(px2+y2)ωγ=DR=x2+y2R2.
In questo caso,
xf(px2+y2) = x
px2+y2f(px2+y2),
y f(px2+y2) = y
px2+y2f(px2+y2)
e quindi l’area `e data da
ZDRr1 + hf(px2+y2)i2dxdy
Z2π
0(ZR
0
rq1 + [f(r)]2dr)dθ= 2πZR
0
rq1 + [f(r)]2dr .
Anche questa formula si chiama formula di Guldino e si interpreta facilmente. Dividendo
l’intervallo [0, R] mediante i punti ri, l’integrale si approssima mediante la somma dei numeri
(2πri)(ri+1 ri)q1 + [f(ri)]2
e questa `e l’area di un tronco di cono “iscritto” nella superficie, come in figura 8.11
8.4. INTEGRALI DI SUPERFICIE 249
Figura 8.11: Calotta di rotazione (caso particolare: paraboloide di rotazione)
−1
−0.5
0
0.5
1
−1
−0.5
0
0.5
1
0
0.2
0.4
0.6
0.8
1
8.4.2 Densit`a superficiale
Si abbia una funzione che ad ogni calotta di una superficie associa un numero. Per esempio,
se la superficie `e realizzata con una lamiera, la funzione che ad una calotta della superficie
associa la sua massa o, nelle applicazioni all’elettrologia, la sua carica. Indichiamo con m(Σ)
questa funzione. La densit`a (di massa, di carica ecc.) media su Σ `e il numero
ρ(Σ) = m(Σ)
A(Σ) .
In questa formula, A(Σ) `e l’area della calotta Σ. Vogliamo ora passare dalla densit`a media
alla densit`a puntuale. Per questo, supponiamo che la superficie sia parametrizzata da
(u, v)r(u, v),(u, v)
e supponiamo che la superficie sia semplice, ossia supponiamo che questa trasformazione sia
iniettiva.
Fissiamo un punto r0sulla superficie,
r0=r(u0, v0).
Sia Qlun quadrato di lato lil cui centro `e (u0, v0) e sia Cll’immagine del quadrato sulla
superficie. Si considera quindi il limite
ρ(r0) = lim
l0
m(Cl)
A(Cl).
Se questo limite esiste finito, lo chiamiamo la densit`a della funzione m.
In realt`a questa definizione `e pi`u delicata di quanto possa sembrare perch`e per il calcolo
del limite si sono privilegiati i quadrati. Niente garantisce che se si fossero scelti dei dischi6
6o peggio ancora dei rombi che diventano via via pi`u “lunghi e sottili”.
250 CAPITOLO 8. INTEGRALI DI CURVA E DI SUPERFICIE
si sarebbe trovato il medesimo limite e in effetti generalmente ci`o non avviene. Diciamo
che, sotto “ipotesi di regolarit`a” della funzione mci`o non accade. Ma non abbiamo i mezzi
necessari per specificare quali siano queste ipotesi.
Il procedimento inverso a questo, porta a definire gli integrali di superficie di prima
specia.
8.4.3 Integrali di superfici di prima specie
Cos`ı come per le curve, anche sulle superfici si definicono due tipi diversi di integrali. Il
primo `e suggerito dal problema del calcolo della massa di una superficie, quando si conosce
la la densit`a ρ, che pu`o variare da punto a punto. Ricordando la definizione di densit`a,
per esempio di massa, non meraviglia che per ritrovare la massa totale della calotta che si
ottiene quando (u, v) varia in una regione γ, delimitata da una curva di Jordan γ, si debba
calcolare Zγ
ρ(x(u, v), y(u, v), z(u, v)) |N(u, v)|dudv .
In generale, un integrale della forma
Zγ
f(x(u, v), y(u, v), z(u, v)) |N(u, v)|dudv . (8.28)
(con f(x, y, z) funzione continua definita sulla calotta) si chiama integrale di superficie di
prima specie o semplicemente integrale superficiale.
E’ chiaro che il valore dell’integrale non cambia cambiando l’orientazione della superficie,
dato che nell’espressione dell’integrale figura non direttamente N, ma il suo modulo. Oltre
a ci`o si potrebbe provare:
Teorema 237 L’integrale di superficie di prima specie non muta cambiando parametrizza-
zione.
Invece di usare la notazione (8.28) si usa in genere la notazione
ZΣ
f(x, y, z) oppure ZΣ
f(x, y, z) dA
(Ainiziale di “area”. Talvolta si scrive dS).
8.4.4 Integrale di superficie di seconda specie
L’integrale di superficie di seconda specie `e suggerito dal calcolo del flusso attraverso una
superficie, che ora definiamo. Sia V(x, y, z) = f(x, y, z)i+g(x, y, z)j+h(x, y, z)kun campo
vettoriale che per`o ora non interpretiamo come campo di forze. Piuttosto pensiamo che
un fluido riempia tutto lo spazio e che la particella che passa per il punto (x, y, z) ci passi
con velocit`a V(x, y, z). Vogliamo calcolare la quantit`a di fluido che, nell’unit`a di tempo,
traversa la superficie. Approssimiamo ancora la superficie con tanti piccoli parallelogrammi
che giacciono sui piani tangenti, come abbiamo fatto per il calcolo dell’area. Sia Puno di
8.4. INTEGRALI DI SUPERFICIE 251
essi. La quantit`a di fluido che nell’unit`a di tempo lo attarversa `e il volume del parallelepipedo
che ha Pper base e la cui altezza `e, circa,
N(x0, y0, z0)
kN(x0, y0, z0)k·V(x0, y0, z0)
(“circa”, perch´e il campo vettoriale non `e costante su P). Si veda la figura 8.12.
Figura 8.12: Flusso attraverso una superficie
−1
−0.5
0
0.5
1
−1
−0.5
0
0.5
1
−1
−0.5
0
0.5
1
V
Il volume va calcolato ora con segno perch´e non `e indifferente che il fluido passi dall’una
all’altra parte della superficie, ed `e dato da
V(x0, y0, z0)·N(x0, y0, z0)
(si ricordi che kN(x0, y0, z0)k`e circa l’area di Pe che N(x0, y0, z0) `e l’area con segno”).
Sommando i contributi di tutti i parallelogrammi si trova una delle somme di Riemann
che approssimano l’integrale di V(x, y, z)·N(x, y, z). Ci`o suggerisce di definire l’integrale
di superficie di seconda specie
Z
V(x(u, v), y(u, v), z(u, v)) ·N(x(u, v), y(u, v), z(u, v)) dudv . (8.29)
Una notazione pi`u semplice che si usa per indicare questo integrale `e
ZΣ
V·dΣ.(8.30)
In questa notazione si sottintende la dipendenza da ue da v.
252 CAPITOLO 8. INTEGRALI DI CURVA E DI SUPERFICIE
Si noti che l’integrale di superficie di seconda specie `e uguale a
ZΣ
V(r)·n(r) dA
con n(r) il versore normale alla superficie.
Si prova:
Teorema 238 Il valore dell’integrale di superficie di seconda specie non muta cambiando
la parametrizzazione della superficie. Esso cambia di segno cambiando l’orientazione.
Osservazione 239 L’integrale di superficie di seconda specie `e un “integrale orientato”:
esso cambia segno cambiando il verso della normale, ossia l’orientazione della superficie.
Consideriamo ora il caso particolare in cui la superficie Σ `e un dominio di integrazione,
Σ = D, del piano (u, v) e quindi `e parametrizzata da
x=u , y =v , z = 0 ,(u, v)Σ.
Sia inoltre
V(x, y, z) = V(x, y) = h(x, y)k.
In questo caso, se la superficie `e orientata positivamenta
ZΣ
V(x, y)· = ZΣ
h(x, y) dxdy=ZD
h(x, y) dxdy, ,
l’usuale integrale doppio di h(x, y). Se per`o la superficie `e orientata negativamente, la
normale punta verso il basso e
ZΣ
V(x, y)· = ZΣ
h(x, y) dydx ,
e questo vale
ZD
h(x, y) dxdy ,
l’usuale integrale doppio cambiato di segno.
8.4.5 Integrale di superficie di seconda specie e forme
differenziali
Sia nel calcolo del lavoro, integrale di curva di prima specie, che nel calcolo del flusso,
integrale di superficie di seconda specie, interviene un campo vettoriale, ma le propriet`a
fisiche di tali campi sono sostanzialmente diverse. E’ quindi utile individuare un formalismo
matematico che permetta di distinguere un caso dall’altro e di distinguere anche visivamente
se un campo vettoriale si vuol usare per il calcolo di un’integrale di curva o di superficie. Per
arrivare a ci`o, vediamo una formula esplicita per il calcolo dell’integrale (8.30), pi`u esplicita
della formula (8.29). Ricordiamo che
N(u, v) = (xui+yuj+zuk)(xvi+yvj+zvk)
= [yuzvzuyv]i+ [zuxvxuzv]j+ [xuyvyuxv]k.
8.5. ANALISI VETTORIALE NELLO SPAZIO 253
L’espressione esplicita di (8.30) `e
Z{f(x, y, z)[yuzvzuyv] + g(x, y, z)[zuxvxuzv] + h(x, y, z)[xuyvyuxv]}dudv
(8.31)
(la dipendenza di x,y,zda ue da vnon si `e indicata per brevit`a).
Se V(x, y, z) = f(x, y, z)i+g(x, y, z)j+h(x, y, z)k`e il campo vettoriale che si vuol
integrare su una superficie, indichiamolo col simbolo
fdydz+gdzdx+hdxdy . (8.32)
Scriviamo inoltre
dx=xudu+xvdv , dy=yudu+yvdv , dz=zudu+zvdv . (8.33)
Usando le “regole di calcolo” (8.24) `e ora facile ricostruire l’espressione dell’integra-
le (8.31). L’integrando si ottiene sostituendo le (8.33) in (8.32) e usando le (8.24) (rispetto
ai simboli due dv). Si trova:
dydx=yuzududu+yuzvdudv+yvzudvdu+yvzudvdv
= (yuzvyvzu) dudv
dzdx= (zuxvzvxu) dudv
dxdy= (xuyvxvyu) dudv
come serve per il calcolo dell’integrale (8.31).
Un’espressione della forma (8.32) si chiama una 2-forma differenziale (il numero 2
ricorda che si vuole integrarla su una superficie, intuitivamente un “foglietto” di dimensione
2.)
Anche le 2-forme differenziali si indicano con lettere greche minuscole,
ω=fdydz+gdzdx+hdxdy .
Completiamo le regole (8.24) imponendo:
dxdx= 0 ,dydy= 0 ,dzdz= 0 ,
dydx=dxdy , dzdx=dxdz , dzdy=dydz . (8.34)
(anche queste regole sono suggerite dalle regole del prodotto vettoriale). Con queste nota-
zioni, la (8.31) si ottiene dalla (8.32) sostituendo x,y,zcon x(u, v), y(u, v), z(u, v); usando
le regole di calcolo precedenti e quindi integrando su Ω.
8.5 Analisi vettoriale nello spazio
Studiamo ora l’analisi vettoriale nello spazio.
254 CAPITOLO 8. INTEGRALI DI CURVA E DI SUPERFICIE
8.5.1 Formula della divergenza e formula di Gauss
L’uguaglianza (8.26) correla le 1-forme differenziali e gli integrali su aree piane. Mostriamo
che esiste una formula analoga, che correla gli integrali delle 2–forme differenziali (ossia, i
flussi di campi vettoriali) e gli integrali di volume.
Limitiamoci a considerare il caso di regioni convesse. Non `e difficile mostrare che la
formula che troveremo vale anche se la regione pu`o rappresentarsi come unione o differenza
di regioni convesse.
Cos`ı come abbiamo fatto per la riduzione degli integrali multipli ad integrali iterati,
indichiamo con zla proiezione sul piano (x, y) di Ω,
z={(x, y)|esiste ztale che (x, y, z)}.
Analogamente definiamo xed y. Sia (x, y)z. La retta verticale per (x, y) interseca
in un segmento [φ(x, y), ψ(x, y)]. Richiediamo che le funzioni φ(x, y), ψ(x, y) siano di classe
C1. Propriet`a analoghe richiediamo anche per le intersezioni con le rette parallele agli assi
delle ascisse e delle ordinate.
Sotto queste condizioni, la regione viene ad essere delimitata da “pezzi” di superfici
regolari. In ciascun punto di tali superfici `e possibile definire la normale. La normale non
sar`a generalmente definita nei punti in cui due “pezzi” diversi si congiungono. Per semplicit`a
noi supporremo che in ogni punto di sia possibile definire la retta normale. Vedremo pi`u
avanti come indebolire questa condizione.
Consideriamo un punto r0= (x0, y0, ψ(x0, y0)) della superficie superficie z=ψ(x, y).
Se un punto r1= (x1, y1, z1) di questa retta appartiene ad Ω, tutto il segmento che lo
congiunge a r0`e in perch´e `e convessa. Dunque, `e possibile definire la normale entrante
e la normale uscente da nel punto r0.
Applichiamo in ogni punto Pdi la normale uscente ad in tale punto. Tale vettore
normale indichiamo col simbolo Ne(P) (l’indice e indica “normale esterna” o uscente dalla
superficie).
Per esempio, fissiamo l’attenzione sulla parte inferiore” della superficie in Fig. 8.13,
parametrizzata da
xi+yj+φ(x, y)k(x, y)z.
Nel caso specifico si tratta di una sfera e se ne considera la parte “sotto l’equatore”. Abbiamo
definito la normale
N(x, y) = (i+φx(x, y)k)(j+φyk) = φx(x, y)iφy(x, y)j+k.
Essendo positivo il coefficiente di k, la normale punta verso l’alto. Dunque entra in Ω.
Invece, noi vogliamo la normale che esce da Ω. Dobbiamo quindi cambiare segno alla
N(x, y) e scegliere
N(x, y) = (i+φx(x, y)k)(j+φyk) = φx(x, y)i+φy(x, y)jk.
Definitione 5 Indicheremo con Ne(r) la normale nel punto ralla superficie Σ che racchiude
Ω, orientata verso l’esterno di Ω.
Vediamo esplicitamente un esempio.
8.5. ANALISI VETTORIALE NELLO SPAZIO 255
Figura 8.13: Una sfera e la parte sotto l’equatore”
−1
−0.5
0
0.5
1
−3
−2
−1
0
1
2
3
−1
−0.5
0
0.5
1
N
N
N
Esempio 240 La superficie sia la sfera x2+y2+z2= 1. Si tratta quindi di una superfi-
cie assegnata in modo implicito. I due emisferi superiore ed inferiore sono parametrizzati
rispettivamente da
z=p1x2y2z=p1x2y2, x2+y2<1.
Si vede facilmente che se si vuole la normale esterna, ossia uscente da Ω, bisogna pa-
rametrizzare l’emisfero superiore scegliendo prima xepoi y; nell’emisfero inferiore bisogna
scegliere prima yepoi x.
Sia ora T(x, y, z) una funzione derivabile. Calcoliamo
Z
z T(x, y, z) dxdydz=Zz"Zψ(x)
φ(x)
z T(x, y, z) dz#dxdy
=Zz
T(x, y, ψ(x, y)) dxdyZz
T(x, y, φ(x, y)) dxdy .
La normale esterna alla superficie di Ω, nei punti (x, y, ψ(x, y)), rispettivamente (x, y, φ(x, y)),
`e:
Ne(x0, y0, z0) = ψx(x0, y0)iψy(x0, y0)j+k,
Ne(x0, y0, z0) = φx(x0, y0)i+φy(x0, y0)jk
Dunque
Z
z T(x, y, z) dxdydz=Zz
Tk·Nedxdy .
256 CAPITOLO 8. INTEGRALI DI CURVA E DI SUPERFICIE
Indichiamo con Σzle due calotte di parametrizzazione φ(x, y) e ψ(x, y). Con questa
notazione e chiamando neil versore
ne=Ne
knek,
l’ultimo integrale `e uguale a
ZΣz
Tk·ne = ZΣz
Tk·dΣ.
Si noti che i grafici delle funzioni φ(x, y) e ψ(x, y) possono non esaurire tutta la frontiera
di Ω, ma una parte della frontiera che non appartiene a tali grafici `e parte di un cilindro
verticale. Ha quindi per normale un vettore ortogonale a ke quindi non d`a contributo al
calcolo dell’integrale.
In modo analogo si mostra che
Z
y S(x, y, z) dxdydz=Zy
Sj·Nedxdy=ZΣy
Sj·ne ,
Z
xR(x, y, z) dxdydz=Zx
Rk·Nedydz=ZΣx
Ri·ne
(le definizioni di Σxe Σysono analoghe a quella di Σz).
Sommando i tre integrali si trova
Teorema 241 (della divergenza ) Sia una regione convessa e limitata, la cui frontiera
`e sostegno di una superficie regolare. Vale
Z
xR(x, y, z) +
y S(x, y, z) +
z T(x, y, z)dxdydz
=Z
div (Ri+Sj+Tk)dxdydz=Z · (Ri+Sj+Tk)dxdydz
=Z{Ri+Sj+Tk}· dΣ.
La superficie Σ`e orientata scegliendo la normale usente da .
Nell’ultimo integrale si intende che la superficie `e orientata mediante la normale esterna.
Il teorema della divergenza ha la seguente interpretazione: il flusso di un campo vettoriale
uscente da una superficie `e uguale all’integrale di volume della divergenza del campo vettoriale
stesso.
Il flusso `e positivo quando il campo vettoriale “esce” da Ω. In tal caso, l’integrale della
divergenza `e positivo, e ci`o, come si `e gi`a notato, spiega l’uso del termine “divergenza”.
Consideriamo ora una caso particolare: supponiamo che il campo vettoriale V(x, y, z)
sia il gradiente di una funzione φ(x, y, z), a valori reali. In questo caso,
divφ(x, y, z) = · φ(x, y, z)
=φxx(x, y, z) + φyy(x, y, z) + φzz (x, y, z) = φ(x, y, z)
8.5. ANALISI VETTORIALE NELLO SPAZIO 257
e quindi si trova:
Z
φ(x, y, z) dxdydz=Zφ·dΣ.
Questo caso particolare del Teorema della divergenza va sotto il nome di Formula di
Gauss .
In fisica hanno importanza queli campi vettoriali che hanno flusso nullo attraverso
ogni superficie chiusa. Tali campi si chiamano campi solenoidali . Una condizione
sufficiente perch`e un campo vettoriale sia solenoidale `e che la sua divergenza sia
nulla. Questa condizione `e solo sufficiente come prova l’esempio seguente:
F(x, y, z) = x
(x2+y2+z2)3/2i+y
(x2+y2+z2)3/2j+z
(x2+y2+z2)3/2k
(proporzionale al campo elettrico di una carica puntiforme, il cui flusso attraverso
una sfera concentrata nella carica non `e nullo, nonostante che · F(x, y, z) = 0).
Se accade che il campo `e ovunque definito e di classe C1allora il campo `e solenoidale
se e solo se la sua divergenza `e nulla.
Vediamo ora di scrivere il il Teorema della divergenza con l’uso del simbolismo delle
forme differenziali.
Sia
ω=Rdydz+Sdzdx+Tdxdy .
Usando le regole (8.34) si trova
dω= (Rx+Sy+Tz) dxdydz . (8.35)
Per uniformit`a, usa chiamare 3–forma differenziale un’espressione della forma
f(x, y, z) dxdydz .
Essa `e niente altro che la funzione scalare f(x, y, z). Si usa questa notazione, per
intendere che questa funzione va integrata su una regione dello spazio R3, con l’avvertenza
per`o che il segno cambia per ogni inversione nell’ordine dei tre simboli dx, dye dz.Ossia, per
esempio,
f(x, y, z) dxdydz=f(x, y, z) dydxdz ,
f(x, y, z) dxdydz=f(x, y, z) dydydx .
Con queste notazioni, il Teorema della divergenza si scrive
Z
ω=Z
dω . (8.36)
In questa formula si intende di aver orientato la normale verso l’esterno di Ω.
258 CAPITOLO 8. INTEGRALI DI CURVA E DI SUPERFICIE
Estensioni
Estendiamo ora la formula della divergenza a regioni pi`u generali. Consideriamo due casi:
Caso 1.
Supponiamo di avere due regioni 1e 2su ciascuna delle quali vale il teorema della
divergenza, e supponiamo che
le due regioni non siano contenute l’una nell’altra, ma si intersechino.
Figura 8.14: Le due regioni
−1
−0.5
0
0.5
1
−1
−0.5
0
0.5
1
0
0.5
1
1.5
2
1
Σ1
Γ1
−1
−0.5
0
0.5
1
−1
−0.5
0
0.5
1
−1
−0.5
0
0.5
1
2 Σ2
Γ2
Indichiamo con de urispettivamente l’unione delle due regionie la differenza 12:
d={r|r1,e anche r/2},
u={r|r1oppure r2}.
Supponiamo che una 2-forma differenziale ω(equivalentemente, un campo vettoriale V(r))
sia di classe C1(R3). Consideriamo la regione d. In questa regione, la (8.36) diviene:
Zd
dω=Z1
dωZ12
dω=Z1
ωZ(Ω12)
ω . (8.37)
Si noti che l’uguaglianza vale perch´e 12`e convessa, come unione di regioni convesse.
La figura 8.15 mostra una sezione dell’insieme su cui si lavora.
L’insieme (Ω12) `e unione di due parti: una parte della frontiera di 1che chiamiamo
Γ1e una parte della frontiera di 2che chiamiamo Γ2. Chiamiamo invece Σ1e Σ2le parti
rimanenti delle frontiere di 1e di 2.
Proseguiamo ora le uguaglianze in (8.37). Si ha:
Z1
ω(Z(Ω12)
ω)=ZΣ1
ω+ZΓ1
ωZΓ1
ω+ZΓ2
ω
ZΣ1
ω+ZΓ2
ω=Z(Ω12)
ω . (8.38)
Ci`o prova che la formula della divergenza vale anche nella regione non convessa ottenuta
come differenza di due regioni convesse.
8.5. ANALISI VETTORIALE NELLO SPAZIO 259
Figura 8.15: Una sezione della regione
−1 −0.8 −0.6 −0.4 −0.2 0 0.2 0.4 0.6 0.8 1
−1
−0.8
−0.6
−0.4
−0.2
0
0.2
0.4
0.6
0.8
1
d=12
Σ1
Γ1
Γ2
Σ2
Osservazione 242 Si noti un problema nel calcolo precedente: la frontiera di 12
non `e regolare e quindi l’uguaglianza in (8.38) non `e perfettamente giustificata da quanto
abbiamo detto prima. Per`o la dimostrazione della formula della divergenza si ottiene con
una catena di integrazioni per parti, che possono giustificarsi anche nel caso in esame.
Caso 2.
Passiamo ora a considerare la regione = 12. Si noti che non `e una regione
convessa e che
= Σ1Σ2
ove Σ1`e la parte della frontiera di 1che non `e contenuta in 2; Σ2`e la parte della frontiera
di 2che non `e contenuta in 1.
Sia inoltre
Γ1= [1]2,Γ2= [2]1.
La figura 8.14 mostra, separatamente a sinistra ed a destra, le due regioni con indicate le
varie parti della frontiera. Le stelle indicano la curva in cui si intersecano.
La figura 8.16 mostra l’unione delle due regioni, con la parte delle due frontiere “visibile
dall’esterno”. E’ chiaro che
Σ = = Σ1Σ2.
Per`o, e la regione `e convessa, e la frontiera `e regolare. Ci`o nonostante, argomenti analoghi
a quelli visti sopra portano a concludere che il teorema della divergenza vale anche nella
regione = 12.
Osservazione 243 Si potrebbe provare che la classe delle regioni per cui vale il Teorema
della divergenza `e assai ampia: tutte le regioni limitate la cui frontiera `e una superficie
regolare orientabile. Discuteremo il concetto di orientabilit`a di una superficie pi`u avanti.
Per ora diciamo soltanto che se una superficie regolare ha per sostegno la frontiera di una
regione limitata, essa si dice superficie chiusa 7.
7Non si confonda il termine “superficie chiusa” col termine “insieme chiuso”.
260 CAPITOLO 8. INTEGRALI DI CURVA E DI SUPERFICIE
Figura 8.16: Ancora la regione
−1
−0.5
0
0.5
1
−1
−0.5
0
0.5
1
−1
−0.5
0
0.5
1
1.5
2
1
2
Σ1
Σ2
Caso 3.
E’ il caso in cui la regione 2sia contenuta nella regione 1, come pu`o essere il caso di due
palle concentriche. In tal caso `e facile vedere che la (8.38) vale ancora. Per`o ora
(Ω12) = [1][[2].
La normale va scelta uscente da 12. E quindi sulla frontiera di 1va scelta la normale
uscente da 1; sulla frontiera di 2va scelta la normale entrante in 2.
8.5.2 La formula di Stokes: il caso delle superfici para-
metriche
La formula di Stokes d`a un’ulteriore relazione che ora collega integrali di curva nello spazio
e integrali di superficie.
Osservazione 244 Abbiamo specificato “curva nello spazio per intendere che se in queste
considerazioni interviene la normale alla curva, come nell’osservazione 245, questa va calco-
lata con la regola con cui si calcola la normale alla curva nello spazio; ossia, n(s) `e colineare
ed ha lo stesso verso di t(s). E ci`o anche se, per caso, la curva che si considera appartiene
ad un piano.
Consideriamo una superficie parametrica Σ
Σ : (u, v)r(u, v) = x(u, v)i+y(u, v)j+z(u, v)k,(u, v).
Supponiamo che la parametrizzazione sia iniettiva e di classe C2.
Consideriamo una curva semplice e chiusa, con sostegno in :
γ:tu(t)i+v(t)j, t [a, b].
8.5. ANALISI VETTORIALE NELLO SPAZIO 261
Indichiamo con γla regione interna alla curva γ. La regione γ`e contenuta in
e la restrizione di r(u, v) alla chiusura di γdefinisce una calotta che indichiamo con Σ1.
Diciamo che la calotta Σ1ha per bordo 8la curva γ1parametrizzata da
tr(t) = r(u(t), v(t))
=x(u(t), v(t))i+y(u(t), v(t))j+z(u(t), v(t))k, t [a, b].
La scelta del verso di percorrenza della curva γstabilisce un’orientazione su γ1mentre
la scelta di considerare icome primo elemento della base di R2stabilisce un’orientazione
sulla normale a Σ1. Le due orientazioni non hanno relazioni tra loro: per esempio sia
Σ : r(u, v) = ui+vj+p1u2v2k.
Le due curve
γ:t1
2[cos ti+ sin tj],˜γ:t1
2[sin ti+ cos tj],
Figura 8.17: Le due orientazioni del bordo
−1
−0.5
0
0.5
1
−1
−0.5
0
0.5
1
0
0.5
1
1.5
2
identificano la medesima calotta, ma le corrispondenti curve γ1e ˜γ1hanno orientazioni
opposte.
Volendo correlare un’integrale sulla superficie Σ1con l’integrale sul suo bordo, dobbiamo
correlare le due orientazioni. Per fissare le idee, consideriamo assegnata l’orientazione della
superficie , ossia il verso positivo della normale e scegliamo di conseguenza quella sulla
curva, ma niente vieta di fare il contrario e talvolta questo `e effettivamente utile.
8Si tratta di una definizione matematicamente non soddisfacente, come si `e notato al
paragrafo 6.3.1.
262 CAPITOLO 8. INTEGRALI DI CURVA E DI SUPERFICIE
Definitione 6 Diciamo che l’orientazione della calotta Σ1e quella del suo bordo γ1sono
concordi quando vale la regola d’ Amp`ere : una persona in piedi sulla superficie nel verso
positivo della normale, vede un punto mobile sulla curva passare dalla sua destra alla sua
sinistra.
Osservazione 245 Facendo tendere ad un punto della curva la posizione della persona che
osserva il moto, si vede che l’orientazione della calotta e quella del suo bordo sono concordi
quando i tre versori della tangente alla curva, della normale alla curva e della normale alla
superficie, presi in quest’ordine, formano un sistema di riferimento positivo. Supponiamo
che un punto P(t) di γ1percorra la curva a partire da P(a), portandosi dietro questo sistema
di riferimento. Dato che la parametrizzazione della superficie `e iniettiva, il punto P(t) torna
alla posizione iniziale quando t=b. E alla fine del giro il sistema di riferimento viene a
trovarsi nella posizione che aveva all’inizio.
Ricordiamo che in queste considerazioni n(s) = t(s)/||t(s)||.
Vale:
Teorema 246 (di Stokes ) Valgano le ipotesi dette sopra, in particolare sia iniettiva e
di classe C2la parametrizzazione della superficie.
Sia γ1il bordo di Σ1eΣ1eγ1abbiano orientazioni compatibili. Sia V(x, y, z)un campo
vettoriale di classe C1, definito su . Vale
ZΣ1
rot V·dΣ=Zγ1
V·dr.(8.39)
Il calcolo che prova questo teorema `e in appendice.
Il significato fisico del teorema di Stokes `e il seguente: La circuitazione del campo vettoriale
lungo il bordo di Σ1`e uguale al flusso attraverso Σ1del rotore del campo vettoriale stesso.
Notiamo che, con le notazioni introdotte per le forme differenziali, anche il Teorema di
Stokes si scrive
ZΣ1
dω=ZΣ1
ω . (8.40)
Infatti, se ω`e una 1–forma differenziale i cui coefficienti sono le componenti del campo vetto-
riale V, `e immediato calcolare che dω`e quella 2–forma differenziale i cui coefficienti sono le
componenti del rotore di V.
Confrontiamo ora le espressioni dei teoremi di Green e di Stokes scritte mediante le
formule differenziali. Si vede che essi si possono ambedue scrivere nella forma generale (8.40).
8.5. ANALISI VETTORIALE NELLO SPAZIO 263
Osservazione 247 Si osservi che nel calcolo l’iniettivit`a della parametrizzazione non si `e usa-
ta. L’iniettivit`a si `e solo usata per l’interpretazione data nell’Osservazione 245. Dunque, la
formula (8.39) vale senza quest’ipotesi, pur di intendere che l’integrale a destra sia sostituito
da
Zb
a
V(x(t), y(t), z(t)) ·r(t) dt .
Per`o in tal caso la curva γpotrebbe essere semplice e la curva γ1potrebbe non esserlo; e
quindi il valore dell’integrale non dipenderebbe soltanto dagli enti geometrici Σ e γ1, ma
dalla loro parametrizzazione, ci`o che non ha senso fisico. Si veda anche l’osservazione 248.
8.5.3 Estensioni
Una prima estensione della formula di Stokes si incontra nel caso in cui la calotta `e delimitata
da due curve, come nella figura 8.18 a sinistra.
Figura 8.18: Estensione al caso del cilindro
−1
−0.5
0
0.5
1
−1
−0.5
0
0.5
1
0
0.2
0.4
0.6
0.8
1
1.2
1.4
1.6
1.8
−1
−0.5
0
0.5
1
−1
−0.5
0
0.5
1
0
0.2
0.4
0.6
0.8
1
1.2
1.4
1.6
1.8
Procedendo come nel caso piano (paragrafo 8.3.5), ossia operando due tagli vicini come
nella figura a destra, ci si riconduce al caso che abbiamo gi`a trattato e quindi per una
superficie siffatta la formula di Stokes assume l’aspetto
ZΣ
dω=ZΣ
ω=Zγ1
ωZγ2
ω .
Il segno negativo di fronte al secondo integrale dipende dal fatto che la curva γ2va orientata
in modo discorde rispetto a quello della superficie, si veda la figura.
In questo caso diremo che il bordo di Σ `e costituito dalle due curve γ1, orientata in
modo concorde, e γ2, orientata in modo discorde, rispetto a Σ.
Si estendono facilmente queste considerazioni al caso in cui il bordo `e costituito da pi`u
curve.
Ricapitolando, abbiamo introdotto la formula di Stokes per superfici date in forma
parametrica. Inoltre, abbiamo esplicitamente supposto che sia possibile orientare la calotta ed
264 CAPITOLO 8. INTEGRALI DI CURVA E DI SUPERFICIE
il suo bordo in modo concorde. Il fatto `e che ci`o talvolta non pu`o farsi e questo `e tanto pi`u
importante perch`e molto spesso in pratica `e necessario usare il teorema di Stokes nel caso in
cui la superficie `e ottenuta “incollando” tanti pezzi di superfici parametriche. Chiameremo
calotta composta una calotta cos`ı ottenuta. Si noti che passando da un pezzo di superficie
ad un altro, la normale pu`o variare in modo discontinuo, si veda la figura 8.19
Figura 8.19: Estensione ad una superficie non regolare
0
0.2
0.4
0.6
0.8
1
0
0.2
0.4
0.6
0.8
1
0
0.1
0.2
0.3
0.4
0.5
E’ chiaro dalla figura che
ZΣ
dω=ZΣ1
dω+ZΣ2
dω
e che la formula di Stokes pu`o applicarsi sia a Σ1che a Σ2; che il contributo degli integrali sul
lato comune si elide e quindi che l’integrale precedente `e uguale alla circuitazione del campo
vettoriale sui segmenti che delimitano la superficie, opportunamente orientati. Indicando
con γla curva che ha tali segmenti come sostegno, vale ancora
ZΣ
dω=ZΣ
ω .
La discontinuit`a della normale non costituisce quindi un problema.
Queste considerazioni sono per`o soltanto apparentemente semplici. Per renderci conto
delle difficolt`a, applichiamole alle superfici nelle due figure 8.20. Queste sono superfici
regolari, il cui bordo `e una curva regolare a tratti, e quindi l’applicazione della formula di
Stokes non presenta problemi.
Modifichiamo ora le superfici come in figura 8.21. E’ ancora ovvio che la formula di
Stokes vale. Ma, modifichiamo ulteriormente le superfici, portando i segmenti affiancati a
8.5. ANALISI VETTORIALE NELLO SPAZIO 265
Figura 8.20: La costruzione del nastro di obius
−1
−0.5
0
0.5
1
0
0.2
0.4
0.6
0.8
1
−0.4
−0.3
−0.2
−0.1
0
0.1
0.2
0.3
0.4
−1.5 −1 −0.5 00.5 11.5
−2
−1
0
1
2
−0.4
−0.3
−0.2
−0.1
0
0.1
0.2
0.3
coincidere. Nel caso della superficie a sinistra, la formula di Stokes vale ancora, nella forma
generalizzata perch´e ora il bordo `e costituito da due curve. Infatti, gli integrali sui due
segmenti si elidono. Invece, tali integrali si sommano nel caso della superficie a destra e
quindi per tale superficie, che si chiama nastro di obius , la formula di Stokes non vale.
Osservazione 248 Si noti che n`e il cilindro n`e il nastro di obius sono superfici “sempli-
ci”, ossia con parametrizzazione iniettiva; ma in un caso la formula di Stokes vale mentre
nell’altro non vale; o meglio, vale la formula di Stokes nell’accezione dell’Osservazione 247,
che semplicemente significa: contare due volte il contributo dei segmenti che si sovrappon-
gono. Notiamo per`o che la posizione dei tali segmenti sul nastro di obius `e arbitraria:
possiamo fare un taglio nella posizione che vogliamo e applicare il Teorema di Stokes alla
superficie ottenuta. D’altra parte il campo vettoriale cambia da punto a punto e questo vuol
dire che il valore dell’integrale cambia a seconda della posizione del taglio, ossia a seconda
del modo che usiamo per calcolare l’integrale. Dunque, tale integrale non dipende dalle sole
propriet`a geometriche del nastro di obius, e non ha alcun significato fisico.
Si suggerisce di costruire un modello del nastro di obius usando una striscia di carta,
e di vedere che il suo bordo consiste di un’unica curva. La circuitazione del campo vettoriale
lungo tale curva non ha alcuna relazione col flusso del rotore attraverso il nastro.
Il nastro di obius `e una superficie regolare, anche se con parametrizzazione non iniet-
tiva. Dunque, l’unico punto in cui pu`o cedere l’argomentazione che porta alla formula di
Stokes `e il punto in cui si cerca di orientare la superficie ed il bordo in modo concorde.
Infatti, ci`o non pu`o farsi. Per vedere ci`o, conviene lavorare col versore normale
n(u, v) = N(u, v)
||N(u, v)|| .(8.41)
Questo versore `e ben definito perch`e N(r) non `e mai nullo. Dunque,
det ru(u, v)rv(u, v)n(u, v)
266 CAPITOLO 8. INTEGRALI DI CURVA E DI SUPERFICIE
Figura 8.21: Il cilindro e il nastro di obius
−1
−0.5
0
0.5
1
−1
−0.5
0
0.5
1
0
1
2
3
4
5
6
7
−1.5
−1
−0.5
0
0.5
1
1.5 −1.5
−1
−0.5
0
0.5
1
1.5
−0.4
−0.2
0
0.2
0.4
non si annulla mai: o `e sempre positivo, o `e sempre negativo. Con la scelta fatta per n(u, v),
esso `e sempre positivo. Sia ora γuna curva chiusa che gira lungo tutto il nastro di obius,
γ:tr(t)
Sia n(t) = n(r(t)). La funzione n(t) varia con continuit`a, ma la continuit`a `e un concetto loca-
le: niente dice dei valori che n(t) prende in punti “lontani”. Chiediamoci allora cosa accade
di n(a) e di n(b). Costruendo un modello del nastro di obius, si vede immediatamente che
n(a) = n(b).
E quindi, non `e possibile orientare la curva γin modo concorde alla superficie.
Ci`o da una parte spiega come mai la formula di Stokes non vale per il nastro di obius
e dall’altra conduce alle seguenti definizioni:
Definitione 7 Sia Σ una superficie composta. Essa si chiama una variet`a se il versore
normale n(r), definito da (8.41), esiste per ogni r, ed `e funzione continua di r. La variet`a si
dice orientabile se lungo ogni arco chiuso r(t), t[a, b], si ha
n(r(a)) = n(r(b)) .
La formula di Stokes vale per variet`a orientabili, il teorema della divergenza vale in regioni
la cui frontiera `e una variet`a orientabile.
Osservazione 249 Le superfici sono state introdotte parametricamente, ma anche come
“superfici di livello” di funzioni F(x, y, z), si veda il capitolo 5. Se la funzione F(x, y, z) `e
di classe C1e il suo gradiente non si annulla, allora le superfici definite da
F(x, y, z) = c
sono superfici orientabili.
8.6. APPENDICI 267
8.6 Appendici
8.6.1 Appendice: fatti da ricordare
Ricordiamo che:
se
ω=fdx+gdy+hdz , V =fi+gj+hk
i coefficienti di dωsono le componenti del rotore di V, ossia di V.
Se
ω=fdydz+gdzdx+hdxdy , V =fi+gj+hk
allora
dω= ( · V) dxdydz= (div V) dxdydz .
Questi fatti vanno ricordati, insieme alla formula seguente, che si ricava facilmente:
div grad f= · [f] = f=fxx +fyy +fzz = f .
8.6.2 Appendice: osservazioni sulla terminologia
Gli argomenti trattati in questo capitolo vanno sotto il nome di “Analisi Vettoriale”. I
termini usati per indicare i singoli argomenti sono per`o variabili da autore ad autore (pra-
ticamente solo il termine “Teorema di Stokes” `e usato da tutti nel medesimo modo, quan-
do applicato alle curve nello spazio). Per esempio, l’integrale di curva di prima specie si
chiama anche integrali curvilineo mentre l’integrale di curva di seconda specie si chiama
anche integrale di linea . I due integrali di superficie si chiamano anche, rispettivamente,
integrale superficiale ed integrale di flusso .
Le varie formule integrali che abbiamo incontrato hanno nomi variabili: la formula di
Green (nel piano) talvolta si chiama anche formula di Riemann ed `e niente altro che
la particolarizzazione a curve piane della formula di Stokes nello spazio. Il Teorema della
divergenza (nello spazio) si chiama anche Teorema di Gauss oformula do Ostrogradski
e talvolta “Formula di Green” ed ha una particolarizzazione al piano che ancora si chiama
“formula di Green”. E quindi opportuno memorizzare il significato fisico dei vari teoremi
per saperli identificare in contesti diversi.
8.7 Appendice: Una dimostrazione del Teore-
ma di Stokes
Dimostriamo il teorema di Stokes in un caso particolare: supponiamo cio`e che la superficie
Σ sia cartesiana, parametrizzata da
Σ : (x, y)(x, y, z(x, y)) .
Per`o per maggior chiarezza indichiamo con (u, v) i punti di Ω; ossia imponiamo la condizione
x=x(u, v) = u,y=y(u, v) = v.
268 CAPITOLO 8. INTEGRALI DI CURVA E DI SUPERFICIE
Notiamo che in questo caso particolare la calotta ed il suo bordo sono orientate in modo
concorde quando la curva γ`e orientata positivamente; ossia quando una punto mobile su γ
vede la regione interna γalla sua sinistra.
Sia V(x, y, z) = f(x, y, z)i+g(x, y, z)j+h(x, y, z)kil campo vettoriale.
Nel nostro caso particolare, si ha
x
u = 1 ,y
v = 1 ,x
v = 0 ,y
u = 0 .
Inoltre, fx=fu,fy=fved analoga notazione per ged h. Dunque si calcola:
Zγ1
fdx+gdy+hdz=Zγfdu+gdv+hz
u du+z
v dv
=Zγ
fdu+gdv+h(zudu+zvdv) = Zγ
(f+hzu) du+ (g+hzv) dv
=Zγ
d [(f+hzu) du+ (g+hzv) dv]
=Zγ
u (g+hzv)
v (f+hzu)dudv
=Zγ
[(gu+gzzu)(fv+fzzv) + (huzvhvzu)] dudv .
Mostriamo che anche il flusso del rotore `e uguale a questo integrale:
ZΣ1
rot V·dΣ=Zγ{(hvgz)(zu)(fzhu)zv+ (gufv)}dudv
=Zγ
[(gu+gzzu)(fv+fzzv) + (huzvhvzu)] dudv .
Ci`o prova l’uguaglianza cercata.
Capitolo 9
Campi conservativi
In questo capitolo studieremo l’esistenza del potenziale di un campo vettoriale, equivalente-
mente, di una primitiva di una forma differenziale. Cambieremo un po’ le notazioni perch´e
in molte applicazioni il potenziale si indica col simbolo V. Quindi useremo un altro simbolo,
per esempio F, per indicare il campo vettoriale.
9.1 Potenziale
Supponiamo che il campo vettoriale F(r) definito su una regione sia il gradiente di una
funzione1V(r) di classe C1. Si sa dalla fisica che la funzione Vsi chiama il potenziale del
campo vettoriale e che un campo vettoriale dotato di potenziale si chiama conservativo . I
campi conservativi hanno grande importanza per le applicazioni.
Si faccia attenzione a non confondersi con i segni: in fisica, V(r) si chiama il po-
tenziale del campo F(r) mentre V(r) ne `e l’ energia potenziale . In fisica si
lavora pi`u frequentemente con l’energia potenziale di F(r), ossia con la funzione
V(r), talvolta indicata come energia potenziale V(r)”. In questo caso V(r) non
`e il potenziale di F(r) ma di F(r).
1ricordiamo che col termine funzione” si indica sempre una funzione univoca.
269
270 CAPITOLO 9. CAMPI CONSERVATIVI
Esempio da tener presente per non confondersi
Da un punto di vista fisico, il potenziale `e il lavoro fatto sul corpo dalla forza
esterna; L’energia potenziale `e il lavoro che il corpo fa, grazie ad un agente esterno
non descritto, contro la forza esterna, e quindi l’energia potenziale `e l’ener-
gia che il corpo accumula “lavorando contro la forza esterna” e che pu`o
restituire in seguito. Per esempio, se l’asse delle quote `e orientato verso l’alto, la
forza peso `e mg. Il lavoro fatto dalla forza peso in uno spostamento da quota xa
quota x+h`e V(h) = mgh eV0+V(h) (V0costante arbitraria ma fissata) `e (un)
potenziale della forza. Se lo spostamento `e verso l’alto il lavoro `e negativo (e quindi
il potenziale diminuisce) mentre l’energia potenziale del corpo `e E0+mgh (E0co-
stante arbitraria ma fissata) e quindi l’energia potenziale aumenta se il corpo viene
portato pi`u in alto (da un agente esterno la cui modalit`a di azione non si descrive:
una leva, un razzo o qualunque altro meccanismo che non interessa descrivere).
Vogliamo dare condizioni atte a riconoscere se un assegnato campo vettoriale `e conser-
vativo su una regione e, se lo `e, vogliamo calcolarne il potenziale.
Per evitare complicazioni puramente tecniche assumeremo che i campi vettoriali e le
funzioni siano definiti e con la regolarit`a che verr`a richiesta in una regione ˜
e che la regione
in cui si lavora abbia chiusura contenuta in ˜
. In questo modo le derivate delle funzioni sono
automaticamente continue sia su che sulla sua chiusura.
Col termine “curva” inoltre intenderemo “curva regolare a tratti”.
Vediamo subito una condizione necessaria che deve essere soddisfatta dai campi conser-
vativi.
Premettiamo quest’osservazione:
Lemma 250 Vale Iγ
F(r)·dr= 0
per ogni curva chiusa γdi sostegno in se e solo se
Zγ1
F(r)·dr=Zγ2
F(r)·dr
per ogni coppia di curve γ1eγ2aventi gli stessi estremi.
Dim.Per la dimostrazione, basta notare che se le due curve γ1eγ2hanno gli stessi estremi,
allora γ1γ2`e una curva chiusa, si veda il Lemma 228, e quindi
0 = Zγ1γ2
F(r)·dr=Zγ1
F(r)·drZγ2
F(r)·dr.
Noto ci`o, proviamo:
Teorema 251 Se F(x, y, z)`e un campo conservativo su una regione allora
Iγ
F·dr= 0
9.1. POTENZIALE 271
su ogni curva chiusa di sostegno in Ω. Equivalentemente,
Zγ
F·dr
ha il medesimo valore su tutte le curve γdi sostegno in , che hanno i medesimi estremi.
Dim.Calcoliamo l’integrale di F(r) integrale su un arco γ. Sia
F(r) = Vx(x, y, z)i+Vy(x, y, z)j+Vz(x, y, z)k.
Si trova
Zγ
Vxdx+Vydy+Vzdz=
Zb
a
[Vx(x(t), y(t), z(t)) ˙x(t) + Vy(x(t), y(t), z(t)) ˙y(t) + Vz(x(t), y(t), z(t)) ˙z(t)] dt
=Zb
a
d
dtV(x(t), y(t), z(t)) = V(x(b), y(b), z(b)) V(x(a), y(a), z(a)) .
Dunque, in questo caso particolare, l’integrale non dipende dalla curva γ, ma solo dai suoi
estremi. In particolare `e nullo se gli estremi coincidono, ossia se la curva `e chiusa.
Il teorema precedente non `e immediatamente usabile, perch´e richiede infinite verifiche;
una per ciascuna curva chiusa di sostegno in Ω. Ci`o pu`o lievemente migliorarsi. Notando che
ogni curva di sostegno in si pu`o approssimare mediante poligonali, si potrebbe provare:
Lemma 252 Accade che Iγ
F·dr= 0
per ogni curva γdi sostegno in se e solo se
IP
F·dr= 0
per ogni poligonale Pdi sostegno in .
Proviamo ora che le condizioni necessarie appena individuate sono anche sufficienti:
Teorema 253 Un campo vettoriale di classe C1
F(r) = f(r)i+g(r)j+h(r)k
ammette potenziale V(r)se e solo se la sua circuitazione lungo ogni poligonale chiusa e
semplice di sostegno in `e nulla.
Dim.La condizione necessaria si `e gi`a provata. Mostriamo che essa `e anche condizione
sufficiente.
Per fissare le idee, supponiamo rR3e quindi
F(r) = u(x, y, z)i+v(x, y, z)j+w(x, y, z)k.
272 CAPITOLO 9. CAMPI CONSERVATIVI
Fissiamo un punto r0qualsiasi in e costruiamo una funzione V(r) in questo modo: sia Pr
una poligonale che congiuge r0con r. L’integrale
ZPr
F(c)·dc
dipende solo dagli estremi della poligonale, ossia dai punti r0er, dato che l’integrale sulle
poligonali chiuse `e nullo. Essendo r0fissato, il valore dell’integrale dipende solo dal secondo
estremo rdella curva. Dunque la funzione
V(r) = ZPr
F(c)·dc
`e ben definita. Mostriamo che essa `e derivabile e che le sue derivate parziali sono le
componenti di F. Consideriamo per questo la derivata rispetto ad x,
Vx(x, y, z) = lim
hh0
V(x+h, y, z)V(x, y, z)
h.
Calcoliamo V(x+h, y, z)) percorrendo prima la curva Pr, che congiunge r0con r, e poi il
segmento parametrizzato da
c1(t) = x+th , c2(t) = y , c3(t) = z , t [0,1] .
Questo segmento congiunge il punto di coordinate (x, y, z) col punto di coordinate (x+
h, y, z).
Indichiamo con Squesto segmento, cos`ı che
V(r+h)V(r) = Zγr
F(c)·dc+ZS
F(c)·dcZγr
F(c)·dc
=ZS
F(c)·dc=Z1
0
[u(x+th, y, z)]hdt .
Dunque, (usando il Teorema 139 nel passaggio dalla penultima all’ultima riga)
Vx(x, y, z) = lim
h0
V(x+h, y, z)V(x, y, z)
h
= lim
h0
1
hZ1
0
[u(x+th, y, z)]hdt= lim
h0Z1
0
u(x+th, y, z) dt
=Z1
0
u(x, y, z) dt=u(x, y, z)
come si voleva. In modo analogo si trattano le altre derivate.
Osservazione 254 Ricordiamo che la circuitazione di un campo di forze lungo una curva
chiusa si interpreta come il lavoro che il campo compie su un punto che percorre la curva.
Il teorema precedente mostra quindi che un campo `e conservativo se e solo se esso compie
lavoro nullo su ogni punto che percorre una qualsiasi curva chiusa di sostegno in .
Inoltre:
9.1. POTENZIALE 273
Teorema 255 Due diversi potenziali del medesimo campo vettoriale, definiti su una mede-
sima regione , hanno differenza costante.
Dim. Perch`e la loro differenza U(x, y, z) = V1(x, y, z)V2(x, y, z) ha derivate parziali tutte
nulle. Dunque `e costante su ogni poligonale e quindi sulla regione Ω.
L’uso del Teorema 253 per verificare se un campo vettoriale `e conservativo, richiede
infinite verifiche e quindi non pu`o usarsi per risolvere problemi concreti. Per dare un criterio
utilizzabile in pratica, ricordiamo la nostra ipotesi, che il campo vettoriale sia di classe
C1.Quindi il potenziale, se esiste, `e di classe C2e quindi il Teorema di Schwarz relativo
all’eguaglianza delle derivate miste mostra:
Teorema 256 Se il campo vettoriale
F(r) = u(x, y, z)i+v(x, y, z)j+w(x, y, z)k
di classe C1`e conservativo, valgono le uguaglianze
uy=vx, uz=wx, vz=wy(9.1)
in ogni punto di .
Dim.Infatti, sia
F(x, y, z) = Vx(x, y, z)i+Vy(x, y, z)j+Vz(x, y, z)k
Ossia, per esempio, u=Vx,v=Vy. Il Teorema di Schwarz mostra che
uy=Vx,y =Vy,x =vx.
Le altre uguaglianze si ottengono in modo analogo.
Osservazione 257 Le condizioni (9.1) sono state scritte per campi vettoriali su R3, ma
naturalmente valgono anche per campi vettoriali in R2. Se n= 2 queste condizioni si
riducono a
uy=vx, ux=vy.(9.2)
Le condizioni (9.1) sono le condizioni per avere
rot F(r) = F(r) = 0 .
Un campo vettoriale il cui rotore `e nullo si dice irrotazionale . Il Teorema 256 si riformula
quindi come segue:
Teorema 258 Ogni campo conservativo `e irrotazionale.
L’esempio seguente mostra che il viceversa non vale:
274 CAPITOLO 9. CAMPI CONSERVATIVI
Esempio 259 Si consideri il campo vettoriale su R2dato da
F(x, y) = y
x2+y2i+x
x2+y2j.(9.3)
Il campo vettoriale (9.3) `e rappresentato nella figura 9.1, a sinistra.
Si vede immediatamente che questo campo vettoriale verifica, ove `e definito, le ugua-
glianze (9.2); per`o non `e conservativo perch`e, calcolando la circuitazione lungo la circonfe-
renza parametrizzata da
γ:x=rcos t , y =rsin t , t [0,2π]
si trova
r2Zγsin2t+ cos2tdt= 2r2π6= 0 .
Dunque, il potenziale non esiste, grazie al Teorema 251.
Se si prova ad usare la costruzione nel Teorema 253, si trova una funzione V(x, y) che
per`o non `e estendibile con continuit`a a tutto il piano privato della sola origine: la funzione che
si ottiene non ammette estensione continua ad almeno una semiretta uscente dall’origine.
Osservazione 260 Il campo vettoriale (9.3) `e il campo di forze prodotto da un filo percorso
da corrente elettrica, in un piano ad esso perpendicolare. Si sa che tale campo di forza pu`o
fornire energia ad una particella che `e vincolata a percorrere una traiettoria circolare centrata
sul filo.
Questo campo di forze `e rappresentato nella figura 9.1, a sinistra.
Ricapitolando, abbiamo una condizione necessaria e sufficiente perch´e un campo sia con-
servativo, espressa dal Teorema 253. Questo teorema per`o richiede di fare infinite verifiche,
e non `e praticamente usabile. Abbiamo poi una semplice condizione necessaria, espressa
dal Teorema 256. Per`o l’esempio precedente mostra che questa condizione non `e sufficien-
te. Essa per`o diviene sufficiente se la regione su cui si lavora ha una semplice propriet`a
geometrica:
Definitione 8 Una regione R2si dice semplicemente connessa se vale
γ
per ogni curva di Jordan γil cui sostegno `e in Ω.
Una regione di R3si dice semplicemente connessa se due qualsiasi punti di
possono congiungersi con una curva regolare2ed inoltre se ogni curva regolare semplice e
chiusa in `e bordo di una superficie parametrica semplice il cui sostegno `e contenuto in
Ω.
2questo fatto `e automaticamente vero perch´e `e una regione, ossia un aperto connesso.
E’ stato enunciato esplicitamente per maggior chiarezza.
9.1. POTENZIALE 275
Intuitivamente, una regione di R2`e semplicemente connessa quando “non ha buchi”.
Una regione di R3semplicemente connessa pu`o avere “buchi” che per`o devono essere “lo-
calizzati”. Per esempio, una corona circolare non `e semplicemente connessa in R2mentre
un guscio sferico `e semplicemente connesso in R3. Invece, togliendo da R3un cilindro
(illimitato in ambedue le direzioni) la regione rimanente non `e semplicemente connessa.
Una classe (molto particolare) di insiemi semplicemente connessi in R3`e quella degli insiemi
convessi.
Proviamo ora:
Teorema 261 Sia F(r)un campo vettoriale di classe C1su una regione . Supponiamo
che F(r)sia irrotazionale.
Se la regione `e semplicemente connessa allora il campo `e conservativo.
Dim.Proviamo il teorema in R2.
Per provare che il campo `e conservativo, dobbiamo provare che vale
Iγ
F(r)·dr= 0
su ciascuna curva regolare, semplice e chiusa γdi sostegno in Ω. Sia γla regione interna
aγ.
Dato che la regione `e semplicemente connessa, γ`e tutta contenuta in e quindi si
pu`o usare il Teorema di Green, ossia il Teorema di Stokes sul piano.
Si ha quindi
Zγ
F(r)·dr=Zγ
rot F(x, y)·kdxdy= 0
perch´e il rotore `e nullo.
La dimostrazione del teorema in R3`e analoga: bisogna ricordare che, per ipotesi, ogni
curva regolare, semplice e chiusa contenuta in `e bordo di una calotta parametrica semplice
Σ, tutta contenuta nella regione Ω, sulla quale si pu`o usare il teorema di Stokes in R3.
Per il Teorema di Stokes, detta γla poligonale e Σ la calotta3, vale
Zγ
F·dr=ZΣ
rot F·dΣ= 0 .
L’esistenza del potenziale segue dall’arbitrariet`a della γ, si veda il Teorema 253.
Osservazione 262
Un disco del piano, o una palla in R3, sono regioni semplice-
mente connesse. Dunque ogni campo irrotazionale `e localmente conservativo. Difficolt`a
possono sorgere solamente se ci si “allontana troppo” dal punto di partenza.
Applicando quest’osservazione al campo vettoriale dell’Esempio 259, possiamo dire
che questo campo vettoriale ammette potenziale per esempio in ogni semipiano o in
ogni angolo che non contiene l’origine.
3orientando Σ e γcon la regola d’Amp`ere
276 CAPITOLO 9. CAMPI CONSERVATIVI
La condizione sulla regione `e solamente sufficiente. Il potenziale di un campo
vettoriale (irrotazionale) pu`o esistere anche in una regione che non `e semplicemente
connessa, come mostra l’esempio seguente. Il campo vettoriale `e definito su R2(0,0):
F(x, y) = x
x2+y2i+y
x2+y2j.
Questo campo vettoriale ammette potenziale su R2(0,0), dato da
V(x, y) = 1
2log(x2+y2).(9.4)
9.1.1 Il calcolo del potenziale
Il Teorema 253 insegna a costruire il potenziale di un campo conservativo: basta calcolarne
gli integrali lungo curve di forma “semplice”, per esempio poligonali che congiungono un
punto r0fissato col generico punto rdella regione. E ovvio per`e che questa via `e pra-
ticamente percorribile solamente se due punti della regione possono congiungersi con un
segmento, in modo da avere integrali facilmente calcolabili. Il caso pi`u semplice `e quello in
cui `e una regione stellata rispetto ad un punto r0(si veda la definizione al paragrafo 3.1.1).
In questo caso esiste un punto r0che pu`o essere congiunto al generico punto r mediante
un segmento
tr0+t(rr0), t [0,1] .
In tal caso, Dalla dimostrazione del Teorema 253,
V(r) = Z1
0
F(r0+t[rr0]) ·[rr0] dt .
Per´o questa non `e l’unica costruzione possibile e non `e la pi`u semplice nemmeno nel caso
di una regione stellata. Di solito, `e pi`u semplice risolvere, con successivi calcoli di primitive,
le equazioni
Vx(x, y, z) = u(x, y, z), Vy(x, y, z) = v(x, y, z), Vz(x, y, z) = w(x, y, z).
Vediamo ci`o su un esempio.
Esempio 263 Sia
F(x, y, z) = r
krk3r=xi+yj+zk.
In questo caso,
u(x, y, z) = x
(x2+y2+z2)3/2,
v(x, y, z) = y
(x2+y2+z2)3/2,
w(x, y, z) = z
(x2+y2+z2)3/2.
Si noti che la funzione non `e definita nell’origine; ma sembra di intuire che su ogni curva
di Jordan regolare che non passa per l’origine si possa appoggiare una calotta regolare che
non incontra l’origine, alla quale applicare il Teorema di Stokes. Inoltre, si vede facilmente
9.1. POTENZIALE 277
Figura 9.1: Un campo vettoriale conservativo ed uno non conservativo
0 2 4 6 8 10 12
0
2
4
6
8
10
12
0 5 10 15 20 25
0
5
10
15
20
25
che il campo vettoriale verifica le uguaglianze (9.1). Si pu`o quindi sperare di costruirne un
potenziale in ogni regione semplicemente connessa che non contiene l’origine.
Per questo si noti che integrando rispetto ad xl’uguaglianza
Vx(x, y, z) = u(x, y, z) = x
(x2+y2+z2)3/2
si trova
V(x, y, z) = 1
px2+y2+z2+ Φ(y, z).
Derivando rispetto ad yed uguagliando a v(x, y, z) si trova
Φy(y, z) = 0
e quindi Φ(y, z) non dipende dalla variabile y:
Φ(y, z) = Φ(z).
Derivando ora V(x, y, z) rispetto a zed uguagliando a w(x, y, z) si trova
Φ(z) = 0
e quindi Φ(z) viene ad essere costante. il campo vettoriale proposto ammette quindi come
potenziali le funzioni
V(x, y, z) = 1
px2+y2+z2+c
ove c`e una qualsiasi costante.
Si osservi che il campo vettoriale dell’esempio precedente `e quello gravitazionale (cam-
biato di segno) e che il potenziale trovato `e il potenziale newtoniano (cambiato di segno).
La figura 9.1, a destra, mostra la restrizione del campo vettoriale al piano x= 0.
Ricordiamo nuovamente che la condizione di irrotazionalit`a `e necessaria per l’esistenza
del potenziale mentre la condizione che la regione sia semplicemente connessa `e solamente
sufficiente. Un campo irrotazionale potrebbe annettere potenziale anche su una regione non
semplicemente connessa. Il potenziale (9.4) mostra un caso di questo tipo.
278 CAPITOLO 9. CAMPI CONSERVATIVI
9.2 Il linguaggio delle 1-forme differenziali
Gli stessi argomenti che abbiamo visto sopra possono riformularsi col linguaggio delle forme
differenziali. In tal caso usa una terminologia un po diversa.
Consideriamo il campo vettoriale e la forma differenziale
F(r) = f(r)i+g(r)j+h(r)k, ω =f(r) dx+g(r) dy+h(r) dz .
Allora:
la condizione F= 0 (campo irrotazionale) equivale alla condizione
dω= 0 .(9.5)
Una forma differenziale che verifica (9.5) si dice chiusa .
la funzione V(r) verifica V(r) se e solo se
dV(r) = ω . (9.6)
Una funzione V(r) per cui vale (9.6) si chiama una primitiva della 1-forma diffe-
renziale ω.
una forma differenziale dotata di primitive si dice esatta .
Possiamo quindi riformulare i teoremi visti per i campi differenziali in questo modo:
una 1-forma differenziale esatta ha integrale nullo su ogni curva chiusa;
una 1-forma differenziale esatta `e chiusa;
1-forma differenziale chiusa su una regione semplicemente connessa `e esatta.
Il linguaggio delle forme differenziali `e particolarmente comodo quando si vuol passare
al caso di forme differenziali di ordine superiore, come ora vediamo.
9.3 Primitive di 2-forme differenziali
Consideriamo ora una 2-forma differenziale
ω=fdydz+gdzdx+hdxdy .
In certe applicazioni ha interesse sapere quando esiste una 1-forma differenziale ˜ωtale che
d˜ω=ω
con ˜ωdi classe C2. Una condizione necessaria `e:
dω= d[ d˜ω] = 0.
Infatti, sia
˜ω=adx+bdy+cdz .
9.3. PRIMITIVE DI 2-FORME DIFFERENZIALI 279
Allora, come si `e visto,
d˜ω= [cybz] dydz+ [azcx] dzdx+ [bxay] dxdy .
Dunque,
d[ d˜ω] = [cyx bzx] dxdydz+ [azy cxy] dydzdx+ [bxz ayz] dzdxdy
= [(azy ayz) + (bxz bzx) + (cyz cxy)] dxdydz
e l’ultima espressione `e nulla per il Teorema di Schwarz.
La condizione dω= 0 si scrive esplicitamente
fx(x, y, z) + gy(x, y, z) + hz(x, y, z) = 0 .(9.7)
Una 2-forma differenziale ωche verifica
dω= 0
si dice chiusa .
Se esiste, una 1-forma differenziale ˜ωper cui
d˜ω=ω
si dice una primitiva di ω; e una 2-forma differenziale dotata di primitive si dice ancora
esatta . Proviamo:
Teorema 264 Una 2-forma differenziale chiusa su un rettangolo `e anche esatta.
Dim. Infatti, supponiamo che la (9.7) valga e mostriamo un modo per costruire la ˜ω.
Uguagliando i coefficienti di ωe di ˜ω, si vede che i coefficienti a(x, y, z), b(x, y, z) e c(x, y, z)
devono verificare
cybz=f , (9.8)
azcx=g , (9.9)
bxay=h . (9.10)
Proviamo a vedere se si trova una 1-forma ˜ωche verifica queste uguaglianze e che ha nullo
uno dei coefficienti, per esempio il coefficiente c. In tal caso, da (9.8) e (9.8) si trova
a(x, y, z) = c1(x, y) + Zz
z0
g(x, y, s) ds
b(x, y, z) = c2(x, y)Zz
z0
f(x, y, s) ds
dove c1(x, y) e c2(x, y) sono arbitrarie funzioni, indipendenti da z.
E ora mostriamo che le funzioni c1(x, y) e c2(x, y) si possono determinare in modo che
valga anche la (9.10). Per ottenere ci`o basta
xc2(x, y)
y c1(x, y) = Φ(x, y, z) = h(x, y, z) + Zz
z0
fx(x, y, s) ds+Zz
z0
gy(x, y, s) ds .
(9.11)
280 CAPITOLO 9. CAMPI CONSERVATIVI
Notiamo che
z Φ(x, y, z) = fx(x, y, z) + gy(x, y, z) + hz(x, y, z) = 0
e quindi in realt`a
Φ(x, y, z) = Φ(x, y).
Notato ci`o, si vede che ci sono infiniti modi per soddisfare (9.11). Un modo `e di scegliere
c1(x, y) = 0 , c2(x, y) = Zx
0
Φ(s, y) ds .
9.4 Alcune formule importanti
Nel corso della trattazione precedente, abbiamo visto che tutte le 0-forme, tutte le 1-forme
e tutte le 2-forme (di classe C2) verificano4
d[ dω] = 0 (9.12)
D’altra parte quest’uguaglianza si verifica facilmente anche per le 3-fome (e anzi, per
le 3-forme si ha addirittura d[fdxdydz] = 0. Vogliamo vedere l’aspetto particolare che
questa formula assume quando si vuole scrivere per mezzo degli operatori differenziali.
Ricordiamo che:
se
ω=fdx+gdy+hdz , V =fi+gj+hk
i coefficienti di dωsono le componenti del rotore di V, ossia di V.
Se
ω=fdydz+gdzdx+hdxdy , V =fi+gj+hk
allora
dω= ( · V) dxdydz .
Dunque, la (9.12) assume la forma:
rot gradf= [f] = 0 ,
div rotV= · [ V] = 0 .
Queste formule vanno ricordate insieme a quella, gi`a incontrata e facilmente ricavabile,
div gradf= · [f] = f=fxx +fyy +fzz .
4nel caso delle 0-forme, ossia delle funzioni f(x, y, z), la (9.12) `e niente altro che il
Teorema di Schwarz.
Capitolo 10
I sistemi di equazioni
differenziali
10.1 Introduzione
Ricordiamo dal corso di Analisi matematica 1 che si chiama equazione differenziale del primo
ordine un’equazione che ha per incognita una funzione x(t), generalmente a valori vettori,
a cui si richiede di verificare
x(t) = f(t, x(t)) .(10.1)
Si parla di problema di Cauchy quando si richiede di risolvere l’equazione differenziale (10.1)
insieme all’ulteriore condizione
x(t0) = x0.(10.2)
Convenzionalmente, la variabile tsi chiama tempo, t0si chiama istante iniziale e la
condizione (10.2) si chiama condizione iniziale ocondizione di Cauchy .
Alcune precisazioni vanno richiamate esplicitamente:
con le lettere in grassetto si intendono vettori e xindica un vettore di dimensione n,
n1. Quando n > 1 la (10.1) si chiama anche un sistema di equazioni differenziali.
Sia xRn. Il dominio dell’equazione differenziale `e una regione (quindi un aperto
connesso) di Rn+1 su cui f(t, x) `e definita. Attenzione che il dominio dell’equazione
differenziale `e sempre un aperto, anche se f(t, x) `e definita su un chiuso pi`u grande,
si veda l’esempio 266.
la funzione incognita x`e calcolata nel medesimo istante tovunque essa compare.
Per soluzione dell’equazione (10.1) si intende una funzione x(t) tale che:
1. x(t) `e definita su un intervallo (a, b) e ivi derivabile.
2. per ogni t, la coppia (t, x(t)) appartiene al dominio dell’equazione differenziale.1
3. per ogni t(a, b) l’uguaglianza (10.1) `e verificata.
1si ricordi che per definizione il dominio di un’equazione differenziale `e un insieme aperto.
281
282 CAPITOLO 10. I SISTEMI DI EQUAZIONI DIFFERENZIALI
Si dice che la soluzione x(t) verifica il problema di Cauchy (10.1), (10.2) quando
t0(a, b) e x(t0) = x0.
Infine, ricordiamo che, come notazione, generalmente invece di (10.1) si scrive
x=f(t, x)
senza indicare la dipendenza di xda t.
Vedremo che, sotto opportune condizioni sulla funzione f(t, x), il problema di Cau-
chy (10.1)-(10.2) ammette soluzione unica, definita su un opportuno intervallo aperto con-
tenente t0. Scriveremo x(t;t0,x0) per indicare la soluzione del problema di Cauchy. Quando
t0`e sottinteso, scriveremo x(t;x0).
Si noti che le soluzioni di equazioni differenziali, essendo funzioni continue definite su
intervalli, sono curve parametriche.
Per chiarire la definizione di soluzione, consideriamo gli esempi seguenti:
Esempio 265 Sia
x= 1 + x2.
Si sa che x(t) = tan tverifica l’uguaglianza in ogni punto tin cui la funzione tan t`e definita.
Per`o x(t) = tan tnon `e soluzione dell’equazione differenziale perch´e non `e definita su un
intervallo. Invece, la restrizione di tan tall’intervallo (π/2, π/2) `e soluzione, cos`ı come `e
soluzione la restrizione di tan tall’intervallo (π/2,3π/2).
Consideriamo ora la funzione tan(t+π/4). Questa funzione `e soluzione dell’equazione
differenziale, sull’intervallo (3π/4, π/4). Dunque, soluzioni diverse della medesima equazione
differenziale possono avere domini DIVERSI; e in generale una soluzione `e definita soltanto su
un piccolo” intervallo.
Inoltre:
Esempio 266 Sia
x=p1x2, x(0) = 0 .
Il dominio della funzione f(t, x) = f(x) = 1x2`e l’insieme chiuso R×[1,1].
Questo per`o non pu`o essere il dominio dell’equazione differenziale perch´e, per definizione, il
dominio dell’equazione differenziale deve essere un aperto. Scegliamo allora come dominio
dell’equazione differenziale l’insieme aperto R×(1,1).
Procedendo per separazione di variabili, si trova che la soluzione `e
x(t) = sin t
definita su (π/2, π/2).Infatti, per t ±π/2 la soluzione tende rispettivamente a 1 e +1.
In questi punti, 1x2`e definita, ma i punti (π/2,1) e(π/2,1) non appartengono al
dominio dell’equazione differenziale. Dunque, per t ±π/2, il grafico (t, x(t)) della soluzione
“esce” dal dominio dell’equazione differenziale.
Chiediamoci ora perch´e `e cos`ı importante insistere sul fatto che una soluzione deve
rimanere all’interno dell’insieme su cui il secondo membro dell’equazione `e definito. La
ragione `e questa: nei due esempi precedenti la soluzione si trova esplicitamente procedendo
per separazione di variabili, ma in pratica la soluzione di un’equazione differenziale deve
10.1. INTRODUZIONE 283
calcolarsi numericamente. Consideriamo per esempio la soluzione x(t) = sin tdell’equazione
nell’esempio 266. Se si vuol ridefinire il concetto di soluzione in modo da accettare che la
soluzione sia definita anche in π/2 e π/2 allora la soluzione viene ad essere definita su R.
Per`o, nessun metodo numerico riuscir`a a trovare tale soluzione perch´e quando t=π/2errori
comunque piccoli fanno uscire dal dominio e bloccano l’algoritmo numerico usato per trovare la
soluzione, qualunque esso sia.
Come si `e visto nel corso di Analisi Matematica 1, si chiama equazione differenziale del
secondo ordine un’equazione nell’incognita x(t) del tipo
x′′(t) = f(t, x(t), x(t))
usualmente scritta senza indicare la dipendenza da t,
x′′ =f(t, x, x).
Si noti che non abbiamo usato lettere in grassetto perch´e in generale studieremo le equazioni
di ordine superiore per incognite scalari (anche se niente vieta di studiare sistemi di equazioni
di ordine superiore, si veda l’Esempio 269).
Il problema di Cauchy si ottiene ora associando all’equazione differenziale le ulteriori
condizioni
x(t0) = x0, x(t0) = x1
ossia ricercando soluzioni dell’equazione differenziale che hanno assegnata posizione e velo-
cit`a in un medesimo istante.
E’ noto dal corso di Analisi Matematica 1 che un’equazione di ordine n`e
x(n)=f(t, x, x, . . . , x(n1)).(10.3)
Il problema di Cauchy corrispondente si ottiene fissando un punto t0e richiedendo che in
questo punto la soluzione cercata verifichi le condizioni
x(t0) = x0, x(t0) = x1, . . . , x(n1)(t0) = xn1.
E’ importante notare che ogni equazione differenziale di ordine npu`o scriversi come sistema
di nequazioni differenziali. La (10.3) pu`o scriversi in forma di sistema come segue: si scriva
x1(t) invece di x(t) e quindi si definiscono x2(t), . . . , xn(t) dalle uguaglianze
˙x1(t) = x2(t)
˙x2(t) = x3(t)
.
.
.
˙xn(t) = f(t, x1(t), x2(t),... ,xn1(t)) .
(10.4)
Osservazione 267 Si noti l’uso intercambiabile dell’apostrofo e del punto per indicare la
derivata rispetto al tempo t.
Mostriamo ora due esempi.
Abbiamo detto che ogni equazione differenziale di ordine npu`o scriversi come sistema.
Invece, il viceversa non vale: esistono sistemi di nequazioni differenziali che non corrispondono
ad equazioni differenziali di ordine n.
284 CAPITOLO 10. I SISTEMI DI EQUAZIONI DIFFERENZIALI
Esempio 268 Si consideri il sistema di equazioni differenziali
x=x , y=y . (10.5)
Le sue soluzioni sono x(t) = etx0,y(t) = ety0. In particolare, la (10.5) `e risolta da
x(t) = et, y(t) = 2et.(10.6)
Si vede subito che nessuna equazione scalare del secondo ordine
x′′ =f(x, x) (10.7)
scritta in forma di sistema del primo ordine, ossia scritta come
x=y , y=f(x, y)
pu`o avere le medesime soluzioni di (10.5). Infatti la prima uguaglianza x=ynon vale se
x(t) ed y(t) sono le funzioni in (10.6).
Esempio 269 Si considerino due punti materiali di massa M1ed M2vincolati a scorrere
(senza attrito) su un segmento orizzontale. Il punto M1`e attaccato ad una molla (di costante
elastica k1) a sua volta fissata nell’origine ed il punto M2`e collegato al punto M1attraverso
una seconda molla di costante elastica k2.
Indichiamo con xed yrispettivamente l’ascissa del primo e del secondo punto. Allora,
le equazioni di Newton per questo sistema sono
M1x′′ =k1x+k2(yx)
M2y′′ =k2(yx).
Si ha quindi un sistema di due equazioni del secondo ordine. Questo pu`o rappresentarsi
come sistema di quattro equazioni del primo ordine,
x
1=1
M1x2
x
2=k1x1+k2(y1x1)
y
1=1
M2y2
y
2=k2(y1x1).
La fisica insegna che la posizione e velocit`a iniziali”, ossia assegnate ad un certo istante
di tempo, e le forze cui il sistema `e soggetto, determinano l’evoluzione futura del sistema.
Dunque, se vogliamo un primo controllo che il modello matematico che abbiamo costruito
effettivamente corrisponda alle propriet`a fisiche del sistema, dovremo verificare che l’evo-
luzione nel tempo delle funzioni x(t), x(t), y(t), y(t) sia univocamente determinata dalla
conoscenza delle costanti M1,M2,k1,k2e dei quattro numeri x(t0), x(t0), y(t0), y(t0). A
questo quesito risponde il Teorema di Cauchy, Teorema 270.
I sistemi di equazioni differenziali considerati negli esempi precedenti sono tutti sistemi
lineari, ossia hanno forma
x=Ax+f
con Amatrice (generalmente dipendente dal tempo, A=A(t)) ed f=f(t) dipendente dal
solo tempo te non da x(anzi, negli esempi, f= 0). Quando f= 0 il sistema si dice lineare
10.1. INTRODUZIONE 285
omogeneo, altrimenti si chiama affine. La funzione f(t) si chiama termine noto. Sono invece
esempi di sistemi non lineari i seguenti
x=x(a+by), y=y(cx +d)
che si incontra in problemi di dinamica di popolazioni (equazione di Lotka-Volterra) oppure
x′′ +ax+cx +ǫx3= cos ωt , ossia x=y
y=ay cx ǫx3+ cos ωt
(equazione di Duffin) che si incontra nello studio delle oscillazioni elastiche.
Un altro esempio importante di equazione differenziale non lineare `e l’equazione di van
der Pol
x′′ =x+µ(x21)x
che si incontra nello studio di certi circuiti elettrici.
Consideriamo ora un caso particolare: supponiamo che l’equazione differenziale (10.1)
abbia forma
x=f(x)
con fche non dipende da t.In questo caso si dice che il sistema `e autonomo otempo
invariante. Esso descrive fenomeni la cui legge fisica `e costante nel tempo e le sue soluzioni
hanno una propriet`a importante: sia x(t) una soluzione e sia y(t) = x(t+τ) con τnumero
fissato ma qualsiasi. Allora,
y(t) = x(t+τ) = f(x(t+τ)) = f(y(t)) ,
ossia y(t) `e ancora soluzione. Si osservi che ci`o non avviene se fdipende anche da tperch´e
in questo caso si trova
y(t) = f(t+τ, y(t))
che `e una diversa equazione differenziale.
La funzione ty(t) = x(t+τ) `e una curva ottenuta riparametrizzando (in modo
molto semplice) la curva tx(t). Per questa ragione, quando si studiano sistemi autonomi,
conviene studiare sia il grafico (t, x(t)) della soluzione sia la curva soluzione” tx(t). Nel
contesto dei sistemi autonomi questa si chiama orbita . Graficamente se ne rappresenta il
sostegno, ossia l’immagine della funzione e, quando serve, si indica anche il verso di percorrenza
al crescere del tempo t.
Un punto x0per cui f(x0) = 0 `e detto punto di equilibrio ostazionario (talvolta si
dice anche soluzione stazionaria .) In tal caso, x(t)x0`e soluzione costante di (10.1). Se
l’equazione differenziale `e autonoma, l’orbita di tale soluzione si riduce al punto x0stesso.
Un punto critico si dice isolato se in un suo intorno non vi sono altri punti critici.
Concludiamo dicendo che le equazioni differenziali che stiamo studiando si dicono “or-
dinarie” in opposizione alle equazioni differenziali a derivate parziali” che si incontrano
quando l’incognita dipende da pi`u variabili e quindi le derivate che compaiono nell’equazione
sono derivate parziali. Come esempio di equazione a derivate parziali si consideri
tx+
s x= 0
e si provi che tutte le funzioni
x(t, s) = φ(ts)
con φdi classe C1risolvono quest’equazione.
286 CAPITOLO 10. I SISTEMI DI EQUAZIONI DIFFERENZIALI
10.2 Esistenza e unicit`a di soluzione
Consideriamo il problema di Cauchy
x=f(t, x),x(t0) = x0.(10.8)
Come si `e notato all’esempio 269, vanno conosciute condizioni che assicurino la risolubilit`a
di questo problema, e condizioni che implichino l’unicit`a della soluzione.
Ricordiamo che per definizione la soluzione deve essere definita in un intervallo che con-
tiene t0al suo interno. E’ sufficiente per`o mostrare che la soluzione esiste in [t0, t0+a)
perch´e lo stesso argomento si potr`a poi applicare all’intervallo (t0a, t0]. Inoltre, prove-
remo l’esistenza di soluzioni in un opportuno intervallo, non necessariamente il pi`u grande
possibile.
Se x(t) risolve (10.8) allora x(t) `e una curva parametrica che nel punto x(t0) ha per
tangente la retta di parametrizzazione
x(t) = x(t0) + f(t0,x(t0))(tt0).(10.9)
Ci`o suggerisce di costruire come approssimazione della soluzione una spezzata costituita da
segmenti delle rette di forma (10.9). Bisogna per`o usare un po’ di cautela, perch´e si sa gi`a
che in generale una soluzione di (10.8) pu`o solo definirsi in un “piccolo intervallo, si ricordi
l’Esempio 265.
Il teorema che si pu`o provare `e il seguente:
Teorema 270 (di Cauchy) Sia x= (x1, . . . , xn)e supponiamo che la funzione f(t, x)
e le sue derivate parziali rispetto alle componenti di xsiano continue in una regione D
contenente il “rettangolo” R
R={(t, x)|t0att0+a , ||xx0|| b}.
Il problema di Cauchy (10.8) ammette soluzione unica su un intervallo (t0T, t0+T)ove
Tdipende sia da t0che da x0.2
La dimostrazione del teorema `e piuttosto tecnica, ma `e opportuno accennare all’idea
che guida la dimostrazione, perch´e questa suggerisce un modo importante di pensare alle
equazioni differenziali.
Costruiamo una successione di funzioni x(N)(t), continue su [t0, t0+T], che, si pu`o
provare, converge a una funzione x(t) che risolve (10.8). Per questo, dividiamo l’intervallo
[t0, t0+T] in Nparti uguali mediante i punti
t0, t0+δ , t0+ 2δ , . . . , t0+ (N1)δ , ove δ=T /N .
2Un possibile valore per Tpu`o costruirsi come segue: Sia
M= max
(t,x)R||f(t, x)||,˜
M= max
imax
(t,x)R
f(t, x)
xi.
Si pu`o scegliere
T < min a , b
M,1
˜
M.
Notare che questo valore di Tnon identifica il pi`u grande intervallo su cui la soluzione
esiste.
10.2. ESISTENZA E UNICIT `
A DI SOLUZIONE 287
Inizialmente siamo nel punto (t0,x0). Definiamo la funzione x(N)(t) sul primo intervallo
[t0, t0+δ] indicandone il grafico: il grafico `e il segmento di retta
y=x(t0) + f(t0,x(t0))(tt0), t [t0, t0+δ].
In questo modo si identifica in particolare x(N)(t0+δ). A partire dal punto (t0+δ, x(N)(t0+
δ)) si ripeta il procedimento: si definisca x(N)(t) per t[t0+δ, t0+ 2δ]:
x(N)(t) = x(N)(t0+δ) + f(t0+δ, x(N)(t0+δ))(t(t0+δ)) , t [t0+δ, t0+ 2δ].
Si ripeta quindi questo procedimento fino a coprire tutto l’intervallo [t0, t0+T]. In generale
avremo, per k= 0,1,...,N 1,
x(N)(t) = x(N)(t0+) + f(t0+kδ, x(N)(t0+kδ))(t(t0+kδ)) , t [t0+kδ, t0+ (k+ 1)δ].
La figura 10.1 illustra questo procedimento.
Figura 10.1: Spezzata di Eulero
In questo modo, per ogni N, si costruisce una spezzata che si chiama spezzata di Eulero .
Si pu`o provare che la successione di funzioni x(N)(t)converge uniformemente ad una
funzione x(t) sull’intervallo (t0T, t0+T), purch´e Tsia opportunamente scelto.
Ora, vorremmo sostituire questa funzione nei due membri di (10.8) trovando che i due
membri differiscono per un errore che tende a zero per N+. Per`o, questo non pu`o
farsi perch´e le funzioni x(N)(t) non sono derivabili; e anche se si potesse fare a poco servi-
rebbe perch´e la sola convergenza uniforme niente permette di concludere sulla derivata della
funzione limite x(t). Viene per`o in aiuto un’altra idea: integrando i due membri dell’equa-
zione differenziale in (10.8) si vede che x(t) risolve (10.8) se e solo se essa risolve l’equazione
integrale
x(t) = x0+Zt
t0
f(s, x(s)) ds . (10.10)
E’ possibile sostituire la x(N)(t) nei due membri dell’equazione integrale, e stimare lo
scarto tra i due membri, provando che esso tende a zero per N+; e usando la sola
convergenza uniforme `e ora possibile completare la dimostrazione del teorema.
288 CAPITOLO 10. I SISTEMI DI EQUAZIONI DIFFERENZIALI
Omettiamo i dettagli della dimostrazione, contentandoci di avere illustrato queste idee
fondamentali.
La dimostrazione del Teorema di Cauchy suggerisce un modo importante di pensare ad
un’equazione differenziale, che illustriamo nel caso del sistema
x=f(x, y), y=g(x, y) :
si pu`o pensare al campo vettoriale f(x, y)i+g(x, y)jcome ad un campo di velocit`a” che
trasporta un pallino inizialmente nella posizione (x0, y0). La traiettoria descritta dal pallino `e la
soluzione del problema di Cauchy con quel dato iniziale. Da questo punto di vista,
il vettore f(x) = f(x, y)
g(x, y)applicato in x=x
y
rappresenta la velocit`a che il pallino ha se transita dalla posizione xall’istante t.
Le isocline
Consideriamo il caso di un sistema autonomo di due equazioni differenziali
x=f(x, y), y=g(x, y).
La dimostrazione del Teorema di Cauchy suggerisce di considerare il luogo dei punti
che vengono incontrati dalle soluzioni dell’equazione differenziale con pendenza assegnata.
Escludendo i punti nei quali sia fche gsi annullano, le orbite sono curve regolari di pa-
rametrizzazione (x(t), y(t)). Per fissare le idee, sia x(t0)6= 0. La pendenza della tangente
nell’istante t0`e
y(t0)
x(t0)=g(x(t0), y(t0))
f(x(t0), y(t0)) .
Se invece x(t0) = 0 allora la tangente `e verticale.
Dunque, le orbite hanno tangente verticale nei punti dell’insieme identificato da f(x, y) =
0; hanno tangente con pendenza mnei punti dell’insieme identificato da
g(x, y)
f(x, y)=m .
Quest’insieme si chiama l’isoclina di pendenza m.L’isoclina di pendenza mha questa pro-
priet`a: le soluzioni escono dai suoi punti con tangenti tutte parallele, con la medesima pendenza
m.Se si riescono a disegnare “molte” isocline e quindi a disegnare su di esse segmenti di
pendenza m, si pu`o pensare di tracciare una soluzione del problema di Cauchy in questo
modo: si parte dal dato (x0, y0), che appartiene ad una certa isoclina, corrispondente alla
pendenza m0. Si traccia per (x0, y0) un segmento parallelo a y=m0xfino ad incontrare la
“successiva” isoclina (successiva, tra quelle tracciate) diciamo corrispondente alla pendenza
m1. Dal punto di intersezione si fa uscire un segmento parallelo a y=m1xfino ad incon-
trare l’isoclina successiva, ecc. Si costruisce una spezzata che approssima la soluzione del
problema di Cauchy.
10.2. ESISTENZA E UNICIT `
A DI SOLUZIONE 289
10.2.1 Equazioni differenziali lineari a coefficienti co-
stanti
Si `e visto, al paragrafo 2.4.4 che l’equazione differenziale lineare a coefficienti costanti
˙
x=Ax+f(t) (10.11)
(con Amatrice n×n) ha per soluzioni le funzioni
x(t) = eAtx0+Zt
0
eA(ts)f(s) ds .
Il membro destro di questa formula si chiama soluzione generale o anche integrale generale
della (10.11).
La soluzione generale della (10.11) si ottiene sommando ad una soluzione particolare,
Zt
0
eA(ts)f(s) ds
tutte le funzioni
eAtx0,x0Rn.
Al variare di x0queste sono tutte le soluzioni dell’equazione lineare omogenea associata ,
ossia dell’equazione che si ottiene dalla (10.11) ponendo f(t) = 0.
Dunque, il calcolo dell’integrale generale si riduce al calcolo dell’esponenziale di matrici
eAt .
Il calcolo di quest’esponenziale `e tutt’altro che semplice in generale e ci limitiamo a studiare
il caso dei “sistemi piani”, ossia il caso in cui xR2.
Consideriamo prima di tutto l’equazione lineare omogenea, ossia assumiamo f(t) = 0.
Dobbiamo ricordare alcune propriet`a delle matrici, che richiamiamo esclusivamente nel caso
di matrici 2 ×2. Propriet`a analoghe valgono in generale, ma la casistica diventa sempre pi`u
complessa all’aumentare delle dimensioni della matrice.
Ogni matrice ammette almeno un autovalore ossia almeno un numero λtale che
det[AλI] = 0 .
Questo discende dal teorema fondamentale dell’algebra, perch´e det[AλI] `e un polinomio
non costante, e quindi ammette almeno uno zero che per`o pu`o essere un numero complesso,
anche se gli elementi della matrice sono reali.
Il polinomio det[AλI] si chiama polinomio caratteristico della matrice A.
In corrispondenza di ciascun autovalore, si trovano soluzioni vnon nulle dell’equazione
lineare
Av=λv.
Questi vettori non nulli si chiamano gli autovettori relativi all’autovalore λ.
Naturalmente, se v`e un autovettore relativo a λ, anche i suoi multipli lo sono.
Dobbiamo osservare che:
290 CAPITOLO 10. I SISTEMI DI EQUAZIONI DIFFERENZIALI
se λ`e un numero complesso, anche i suoi autovettori sono autovettori a elementi
complessi; ossia, implicitamente anche se gli elementi della matrice Asono reali, ci
riconduciamo a lavorare con vettori ad elementi complessi;
autovettori relativi ad autovalori diversi sono linearmente indipendenti.
Consideriamo la funzione
x(t) = eAtv.
Allora, d
dteAtv=AeAtv
`e una soluzione della (10.11) (anche se vnon `e autovettore di A). Se
Av=λv,
si ha
eAtv="+
X
n=0
An
n!#v="+
X
n=0
Anv
n!#=
+
X
n=0
λnv
n!
ossia
eAtv=eλtv.
Dunque, noto un autovalore λe un suo autovettore v, `e facile scrivere alcune soluzioni
dell’equazione lineare omogenea: sono le funzioni
αeλtv
con αcoefficiente qualsiasi (in generale, coefficiente complesso).
Esista ora un secondo autovalore µe sia wun suo autovettore. Allora, anche le funzioni
βeµtw
risolvono l’equazione ldifferenziale lineare omogenea
x=Ax; (10.12)
e quindi anche le funzioni
αeλtv+βeµtw(10.13)
la risolvono.
Quanto detto fin’ora vale per sistemi di qualunque dimensione. Supponiamo ora che il
sistema sia di dimensione 2.
Dato che i vettori vewsono linearmente indipendenti, ogni vettore a due dimensioni
xsi pu`o rappresentare in modo unico come
x=αv+βw;
Ossia, al variare dei coefficienti αeβ, le funzioni (10.13) permettono di esprimere tutte le
soluzioni di (10.12). Dunque, la (10.13) `e la soluzione generale di (10.12).
Si noti che il fatto importante `e l’esistenza di due autovettori vewlinearmente in-
dipendenti: le considerazioni precedenti possono ripetersi anche se i due autovettori vew
corrispondono ad un medesimo autovalore, ossia se λ=µ.
Sfortunatamente, non `e vero che ogni matrice 2 ×2 debba avere due autovettori linear-
mente indipendente, come mostra l’esempio seguente:
10.2. ESISTENZA E UNICIT `
A DI SOLUZIONE 291
Esempio 271 Gli autovettori della matrice
0 1
0 0
sono tutti i multipli di
v=1
0:
Questa matrice non ha due autovettori linearmente indipendenti.
In tal caso, si procede come segue: si identifica (l’unico) autovettore λed un suo
autovettore v. Ricordiamo che per definizione v6= 0. Quindi si considera l’equazione
(AλI)w=v.
E’ un fatto che, se A, matrice 2 ×2, non ha due autovettori linearmente indipendenti,
quest’equazione ammette soluzione w, e inoltre w`e linearmente indipendente da v.
Identificati vew, si costruiscono due polinomi, a valori vettori, uno di grado 0 ed uno
di grado 1:
p0=v,p1=vt+w.
Nel caso che stiamo ora considerando, si verifica facilmente per sostituzione che la soluzione
generale di (10.12) `e
eλt [αp0+βp1(t)] .(10.14)
Abbiamo quindi scritto la soluzione generale di (10.12) in ciascuno dei casi che possono
presentarsi: in tutti i casi la soluzione generale `e combinazione lineare di due soluzioni
fondamentali. Delle soluzioni
eλtp0, eλtp1(t)
delle soluzioni
eτ tv, eµtw
(con λ=µoppure λ6=µ) quando la matrice Aammette due autovettori linearmente
indipendenti. Queste coppie di soluzioni di (10.12) si chiamano un sistema fondamentale
di soluzioni.
Rimane da chiarire un punto: se la matrice A`e reale ma ammette due autovalori
complessi e coniugati, le soluzioni scritte sopra prendono valori complessi. Vorremmo trovare
un diverso sistema fondamentale di soluzioni, che per`o prendano valori reali.
Il caso degli autovettori complessi e coniugati Le considerazioni prece-
denti valgono per ogni matrice Asia che i suoi autovalori siano reali sia che siano complessi.
Se per`o la matrice 2 ×2 ha elementi reali ed un autovalore λcomplesso, allora anche ¯
λ`e
autovalore; e quindi siamo automaticamente nel caso in cui la matrice ha due diversi auto-
valori e quindi due autovettori linearmente indipendenti: la soluzione generale di (10.12) `e
data da (10.13).
Siano
λ±=ξ±
292 CAPITOLO 10. I SISTEMI DI EQUAZIONI DIFFERENZIALI
gli autovalori e sia v+=v1+iv2un autovettore di λ+. In quest’espressione, v1ev2sono
vettori reali, che per`o non sono essi stessi autovettori di A.E’ un fatto che
¯
v+=v1iv2
`e un autovettore di λ. Usando la (10.13) si vede quindi che un sistema fondamentale di
soluzioni `e
eξt et (v1+iv2)
=eξt [(v1cos ωt v2sin ωt) + i(v2cos ωt +v1sin ωt)]
eξt et (v1iv2)
=eξt [(v1cos ωt v2sin ωt)i(v2cos ωt +v1sin ωt)] .
(10.15)
Queste soluzioni prendono valori complessi. Sommandole e sottraendole (e dividendo rispet-
tivamente per 2 e per 2i) si trovano due soluzioni a valori reali:
eξt [v1cos ωt v2sin ωt], eξt [v1cos ωt +v2sin ωt].
Questo anche `e un sistema fondamentale di soluzioni, a valori reali. Infatti, combinandole
linearmente si ritrovano le (10.15) e quindi ogni altra soluzione di (10.12).
10.2.2 Equazioni completi ed equazioni di ordine supe-
riore
Limitandoci ancora al caso di sistemi di due equazioni, mostriamo un metodo per risolvere
l’equazione completa. Abbiamo bisogno di un risultato di algebra lineare, che `e questo:
scriviamo esplicitamente il sistema in forma
x=ax +by +f1
y=cx +dy +f2(10.16)
e consideriamo la matrice
A=a b
c d .
Mostriamo:
Teorema 272 Esiste una matrice P(generalmente ad elementi complessi) tale che det P6=
0e inoltre tale che
P AP 1=Pa b
c d P1=α β
0δ.
Dim.Bisogna ricordare che ogni matrice ammette almeno un autovalore ed un corri-
spondente autovettore, che in generale sono complessi. Dunque si trovano veαtali
che
Av=αv.
Sia wun qualsiasi vettore indipendente da ve consideriamo la matrice
P1=v w .
10.2. ESISTENZA E UNICIT `
A DI SOLUZIONE 293
Questa matrice trasforma gli elementi della base canonica ordinatamente in vew. La sua
inversa quindi trasforma ordinatamente vewnella base canonica. E’:
AP 1=αv z z=Aw=βv+δw
e quindi
P AP 1=α β
0δ.
Sia ora
g(t) = g1(t)
g2(t)=Pf(t) = Pf1(t)
f2(t)
Applicando la trasformazione Pal sistema, questo si riduce a
ξ=αξ +βη +g1(t), η=δη +g2(t).
La seconda equazione `e un’equazione nella sola incognita η(t), che si sa risolvere; nota
η(t), questa funzione si sostituisce nella prima equazione, ottenendo un’equazione nella sola
incognita ξ, che ancora si sa risolvere.
Calcolate le funzioni ξ(t) ed η(t), la soluzione x(t) si ottiene come
x(t) = P1ξ(t)
η(t).
Quando il termine noto ha forma “particolare”, dal corso di Analisi Matematica 1, si sa
che conviene ricercare una soluzione di forma particolare”. Consideriamo quest’esempio:
x=αx +βy +eγt , y=δy +eσt .
La risoluzione di questo sistema pu`o farsi semplicemente con le tecniche viste nel corso di
Analisi Matematica 1 e quindi non entriamo nei dettagli del calcolo. Notiamo per`o che se
δ6=σallora le soluzioni della seconda equazione hanno forma
aeδt +beσt .
Se per`o δ=σallora le soluzioni sono
aeδt +bteδt .
Inserite queste nella prima equazione, la soluzione della prima equazione ha forma rispetti-
vamente
ceαt +aeδt +beσt oppure ceαt +aeδt +bteδt
se α`e diverso dagli esponenti che si sono incontrati risolvendo la seconda equazione; altri-
menti compariranno fattori tncon n > 1. Si esaminino i vari casi e si ritrovi che i possibili
valori di nsono 0, 1 e 2.
E ora consideramo il caso di un sistema omogeneo di tre equazioni differenziali lineari.
Anche in questo caso esistono trasformazioni di coordinate che “triangolarizzano” il sistema,
ossia lo riducono a forma
x=αx +βy +χz
y=δy +σz
z=γz
Anche questo sistema si risolve a partire dall’ultima equazione e, risoltala, si vede che
z(t) = aeγt. Sostituita queste funzione nelle prime due equazioni, ci si riconduce al caso di
due equazioni lineari con termine affine visto sopra. E quindi nell’espressione delle prime
due componenti compariranno termini della forma tneγt con n= 0, n= 1 oppure n= 2.
294 CAPITOLO 10. I SISTEMI DI EQUAZIONI DIFFERENZIALI
10.2.3 Il comportamento in futuro delle soluzioni
Spesso interessa conoscere il comportamento delle soluzioni di un sistema di equazioni dif-
ferenziali per t+. Quando si fa questo studio, si dice che si studia il “comportamento
in futuro” delle soluzioni. Facciamo questo studio nel caso dei sistemi lineari omogenei di
due equazioni differenziali. In tal caso, le soluzioni sono funzioni x(t) con x(t) vettore a
due componenti x(t) ed y(t). Dunque le soluzioni rappresentano curve parametriche piane.
Per questo, i sistemi due due equazioni differenziali si chiamano anche sistemi piani ed il
piano (x, y) si chiama piano delle fasi .
Vogliamo descrive le soluzioni di un sistema lineare omogeneo piano sul piano delle fasi
e vedere come il comportamento dipenda dagli autovalori della matrice Ae, se c’`e un solo
autovalore, anche dal fatto che esistano due autovettori linearmente indipendenti, o uno
solo.
La soluzione stazionaria x(t) = 0esiste sempre. Noi considereremo solamente il caso in
cui
ker A=0
ossia in cui il sistema differenziale ammette un’unica soluzione stazionaria, e questa `e
x(t) = 0. Interessa conoscere il comportamente delle altre soluzioni rispetto alla soluzione
stazionaria. Questo comportamento viene descritto introducendo opportune definizioni3.
Nel caso lineare per`o non abbiamo bisogno dei dettagli di queste definizioni. Diciamo per
ora che interessa sapere se tutte le soluzioni rimangono limitate e se tutte le soluzioni ten-
dono a zero per t+. Naturalmente tutte le soluzioni rimangono limitate se le due
soluzioni che costituiscono un sistema fondamentale di soluzioni sono ambedue limitate;
tutte le soluzioni tendono a zero per t+se ci`o accade per ambedue gli elementi di un
sistema fondamentale di soluzioni.
Ricapitoliamo i casi che si possono presentare: casi:
1) la matrice Aha due autovettori indipendenti v1ev2, corrispondenti rispettivamente agli
autovalori reali λ1eλ2(non necessariamente distinti). Allora un sistema fondamentale di
soluzioni `e dato da
x1(t) = eλ1tv1,x2(t) = eλ2tv2;
2) la matrice Aha due autovettori complessi coniugati v±iwe corrispondenti rispettiva-
mente agli autovalori complessi coniugati α± . Un sistema fondamentale di soluzioni `e
dato da
x1(t) = eαt(cos(βt)vsin(βt)w),x2(t) = eαt(cos(βt)w+ sin(βt)v);
3) la matrice Aha un solo autovalore λma non vi sono due autovettori indipendenti. Allora,
detto v1un autovettore, si risolve il sistema4(AλI)v2=v1e un sistema fondamentale
di soluzioni `e dato da
x1(t) = eλtv1,x2(t) = eλt(tv1+v2).
Esaminando separatamente questi tre casi, si vede che valgono i risultati elencati nella
tabella seguente:
3di “stabilit`a”, che vedremo piu’ avanti nel caso non lineare.
4si tratta di un sistema la cui matrice dei coefficienti `e degenere, ma si dimostra che `e
compatibile
10.2. ESISTENZA E UNICIT `
A DI SOLUZIONE 295
Tabella 10.1: Comportamento asintotico delle soluzioni dei sistemi lineari
piani
Due autovettori Soluzioni limitate in futuro se e solo se
linearm. indipendenti ambedue gli autovalori hanno parte reale non positiva
Due autovettori Le soluzioni tendono a zero per t+se e solo se
linearm. indipendenti ambedue gli autovalori hanno parte reale negativa
Autovettori tutti le soluzioni sono limitate in futuro se e solo se
linearmente dipendenti δ`e negativo
(e quindi un solo autovalore δ) (tutte le soluzioni tendono a zero per t+).
I casi che possono presentarsi sono ben rappresentati negli esempi seguenti.
Esempio 273
il caso di due autovalori reali distinti e di segno concorde. In questo
caso le soluzioni del sistema diagonalizzato hanno forma
x(t) = eλtx0, y(t) = eµty0.
Le orbite sono le curve
yλ=cxµ
percorse verso l’origine se gli autovalori sono negativi, allontanandosi dall’origine
altrimenti.
Se λ=µle orbite sono rette.
Questo caso `e illustrato dalla figura 10.2 a sinistra. Questa configurazione di orbite
si chiama nodo.
I due autovalori sono reali, di segno opposto. In questo caso le soluzioni sono della
forma
x(t) = eλtx0, y(t) = eµty0
con, per esempio, λ > 0 e µ > 0. Nel caso λ=µle orbite sono le iperboli
xy = cost.
e per questa ragione il punto di equilibrio (0,0) si dice di tipo iperbolico, o di sella.
La figura (10.2) a destra illustra questo caso.
I due autovalori sono puramente immaginari, e coniugati. In questo caso le soluzioni
hanno forma
x(t) = Acos(ωt +φ), y(t) = Asin(ωt +φ).
Le orbite sono le circonferenze
x2+y2=A2.
Il caso `e illustrato nella figura 10.3 a sinistra, e il punto di equilibrio si chiama ora
centro.
296 CAPITOLO 10. I SISTEMI DI EQUAZIONI DIFFERENZIALI
Figura 10.2: Nodo e punto di sella
−2 −1.5 −1 −0.5 0 0.5 1 1.5 2
−20
−15
−10
−5
0
5
10
15
−0.5 −0.4 −0.3 −0.2 −0.1 0 0.1 0.2 0.3 0.4 0.5
−20
−15
−10
−5
0
5
10
15
20
x
y
Figura 10.3: Centro e fuoco
−3 −2 −1 0 1 2 3
−3
−2
−1
0
1
2
3
−0.8 −0.6 −0.4 −0.2 0 0.2 0.4 0.6 0.8 1
−0.5
0
0.5
1
I due valori sono numeri complessi e coniugati, ma non puramente immaginari. In
questo caso le soluzioni hanno forma
x(t) = Aeat cos(ωt +φ), y(t) = Aeat sin(ωt +φ).
In coordinate polari sono descritte da
r(t) = Aeat , θ(t) = ωt +φ
e sono quindi spirali che si avvolgono verso l’origine se a < 0, altrimenti si allontanano
dall’origine. Il punto d’equilibrio (0,0) `e ora detto fuoco. Questo caso `e illustrato
nella figura 10.3, a destra.
Il numero a`e la parte reale comune ai due autovalori.
10.3. LA STABILIT `
A297
10.3 La stabilit`a
Consideriamo ora il sistema non lineare autonomo5
x=f(x).(10.17)
Per semplicit`a supponiamo che tutte le soluzioni di (10.17) siano definite su [0,+).6
Ricordiamo che i punti di equilibrio sono quei punti x0tali che f(x0) = 0. I punti di
equilibrio corrispondono a soluzioni costanti e spesso queste sono le pi`u importanti” tra
le soluzioni dell’equazione differenziale. Per questa ragione, interessa sapere come si com-
portano soluzioni il cui dato iniziale poco differisce da un punto di equilibrio; in particolare
interessa sapere se per t+tali soluzioni tendono o meno al punto di equilibrio stesso.
Introduciamo le definizioni seguenti.
Definitione 9 Diciamo che tutte le soluzioni di (10.17) sono limitate in futuro quando
per ogni x0esiste Mx0tale che
||x(t;x0)|| < Mx0t > 0.
In modo analogo si definisce la limitatezza in passato. .
Si dice che le soluzioni di (10.17) sono limitate quando sono limitate sia in futuro che
in passato.
Esempio 274 Consideriamo l’equazione scalare
x=ax ,
le cui soluzioni sono x(t) = ceat. Tutte le soluzioni sono limitate in futuro ma non in passato
se a < 0; sono limitate in passato ma non in futuro se a > 0; sono limitate se a= 0.
Presentiamo ora le definizioni di stabilit`a, con riferimento ad un punto di equilibrio y0.
Definitione 10 Diciamo che il punto di equilibrio y0`e
stabile quando per ogni ǫ > 0esiste σ > 0tale che se ||x0y0|| < σ allora
||x(t;x0)y0|| < ǫ per ogni t > 0(si noti: σǫ).
attrattivo se esiste σ > 0tale che se ||x0y0|| < σ allora limt+||x(t;x0)|| =y0.
L’insieme dei vettori x0tali che limt+||x(t;x0)|| =y0si chiama il bacino d’attrazione
di y0.
asintoticamente stabile se `e sia stabile che attrattivo.
Osservazione 275 E’ bene notare che l’attrattivit`a non implica la stabilit`a.
5le definizioni di questo paragrafo possono adattarsi anche al caso dei sistemi non
autonomi. Tal caso `e pi`u delicato e non lo consideriamo.
6non `e restrittivo assumere che l’istante iniziale t0sia 0 perch´e il sistema `e tempo
invariante.
298 CAPITOLO 10. I SISTEMI DI EQUAZIONI DIFFERENZIALI
Si potrebbe pensare che se y0`e un punto di equilibrio stabile allora si possa sempre
scegliere δ=ǫ. L’esempio seguente mostra che questa congettura `e falsa:
Esempio 276 Si consideri il sistema
x= 2y , y=x .
L’unico punto di equilibrio `e y0= (0,0).
Derivando la prima equazione si vede che
x′′ =2x
e questa `e l’equazione del moto armonico. Dunque, le soluzioni del sistema sono
x(t) = Acos 2t+φ , y(t) = A
2sin(2t+φ).
Dunque le soluzioni descrivono l’ellisse
x2+ 2y2= 1 .
Sono tutte limitate e inoltre se si assegna ǫsi pu`o trovare un δtale che
||(x0, y0)|| < δ = ||(x(t), y(t))|| < ǫ .
Per`o, δva scelto strettamente minore di ǫ, si veda la figura 10.4.
Figura 10.4: Nella definizione di stabilit`a in generale si deve scegliere δ < ǫ
−2 −1.5 −1 −0.5 0 0.5 1 1.5 2
−2
−1.5
−1
−0.5
0
0.5
1
1.5
2
ε
δ
(x0,y0)
E
10.3. LA STABILIT `
A299
Tabella 10.2: La stabilit`a dei sistemi lineari piani
Due autovettori Soluzione nulla stabile se e solo se
linearm. indipendenti ambedue gli autovalori hanno parte reale non positiva
Due autovettori Soluzione nulla asintoticamente stabile se e solo se
linearm. indipendenti ambedue gli autovalori hanno parte reale negativa
Autovettori tutti soluzione nulla asintoticamente stabile se e solo se
linearmente dipendenti l’unico autovalore `e negativo
(e quindi un solo autovalore δ)
Quest’esempio verr`a nuovamente esaminato in seguito.
Osserviamo che se il punto di equilibrio y0`e stabile allora le soluzioni (con dato iniziale
sufficientemente vicino a y0) sono limitate in futuro e addirittura in modo uniforme: se
||x0y0|| < δ allora ||x(t;x0)|| < ǫ +||y0|| =Mx0. In questo caso Mx0=ǫ+||y0|| `e
indipendente da x0(se ||x0y0|| < δ). Il viceversa non vale:
Esempio 277 Consideriamo il sistema descritto in coordinate polari da
r=r(1 r), θ= 1 .
r(t) = 1 `e una soluzione costante e, procedendo per separazione di variabili,
log r(t)
|1r(t)|=t+c
(si ricordi che r0). Dunque, le soluzioni sono
θ(t) = t+h , r(t) =
ket
1+ketcon k > 0 se 0 r(0) <1
1 se r(0) = 1
ket
ket1con k > 1 se r(0) >1.
Le soluzioni descrivono delle spirali che si avvolgono intorno alla circonferenza di raggio 1.
Tutte le soluzioni sono limitate ma scegliendo un intorno dell’origine di raggio minore di 1,
non si riesce a rimanere in quest’intorno scegliendo di partire “vicini” all’origine. Si veda la
figura 10.5.
Concludiamo notando che i risultati della tabella 10.1, che si riferisce ai sistemi lineari
piani autonomi, possono riformularsi con la terminologia della stabilit`a. Si ottiene cos`ı la
tabella 10.2, nella quale y0= 0.
Si pone ora il problema di sapere quando un punto di equilibrio di un sistema piano
`e stabile oppure asintoticamente stabile. Questo `e generalmente un problema piuttosto
difficile. I due test pi`u semplici che possono usarsi sono il Teorema di Lagrange, per la
stabilit`a, e il teorema sulla stabilit`a “in prima approssimazione”, per la stabilit`a asintotica.
Per chiarire il significato del Teorema di Lagrange, conviene introdurre la nozione di integrale
primo, che ha un’importanza fondamentale in tutte le applicazioni della matematica.
300 CAPITOLO 10. I SISTEMI DI EQUAZIONI DIFFERENZIALI
Figura 10.5: Il caso dell’esempio 277: la limitatezza delle soluzioni non implica
la stabilit`a
−2 0 2 4 6 8 10 12
−1.5
−1
−0.5
0
0.5
1
1.5
10.4 Sistemi piani ed integrali primi
Il concetto di integrale primo non `e limitato ai sistemi piani, ma `e in questo caso particolare
che noi lo studieremo. Consideriamo quindi il sistema piano
x=f(x, y), y=g(x, y).(10.18)
Si chiama integrale primo una funzione V(x, y) di classe C1tale che:
gli zeri di V(x, y) sono isolati;
ogni orbita di (10.18) `e contenuta in una curva di livello di V(x, y).
Integrali primi possono non esistere, ma se esistono non sono mai unici: se V(x, y) `e un
integrale primo, anche cV (x, y) e V(x, y) + c(con ccostante) lo sono.
E’ un fatto che molto spesso quando un integrale primo si pu`o trovare allora questo d`a
informazioni importanti sul comportamento delle soluzioni dell’equazione differenziale. Per
esempio:
se si riesce a trovare un integrale primo allora le orbite del sistema (10.18) si possono
(almeno localmente) calcolare risolvendo l’equazione (non differenziale) V(x, y) = c.
Grazie al Teorema della funzione implicita, ci`o `e lecito nell’intorno dei punti nei quali
il gradiente di V(x, y) non si annulla.
Se le curve di livello di un integrale primo sono tutte limitate, allora le soluzioni
dell’equazione rimangono limitate al trascorrere del tempo.
10.4. SISTEMI PIANI ED INTEGRALI PRIMI 301
Gli integrali primi hanno una relazione importante con le propriet`a dei campi vettoriali.
Provando il Teorema di Cauchy, abbiamo visto che al sistema (10.18) conviene associare il
campo vettoriale
F(x, y) = f(x, y)i+g(x, y)j.
Associamogli anche il campo vettoriale
G(x, y) = g(x, y)i+f(x, y)j
ortogonale a F(x, y) in ogni punto.
Supponiamo che G(x, y) ammetta potenziale V(x, y). Allora, lungo le soluzioni di (10.18)
si ha: d
dtV(x(t), y(t)) = Vxx+Vyy=gf +f g = 0 .
Ossia, V`e un integrale primo di (10.18). Condizione necessaria per l’esistenza del potenziale
V(x, y) del campo G(x, y) `e che
gy=fx
Dunque:
Teorema 278 Supponiamo che il dominio del sistema piano sia una regione di Jordan. Se
div F(x, y) = 0
allora il sistema piano ammette integrali primi.
Ovviamente, esistono sistemi che non ammettono integrali primi. Esistono per`o anche
sistemi che ammettono integrali primi e che non soddisfano alle condizioni del Teorema 278,
che d`a una condizione solo sufficiente per l’esistenza di integrali primi:
Esempio 279 Si consideri il sistema piano
t= 1 , x=x .
Chiaramente, la condizione del Teorema 278 non `e soddisfatta, ma integrali primi esistono:
V(t, x) = xet
`e infatti un integrale primo.
Ci`o nonostante, il caso descritto nel Teorema 278 `e particolarmente importante per le
applicazioni. Indicando con H(x, y) un integrale primo, si ha H=g f , ossia
f=Hy, g =Hx
e quindi il sistema piano (10.18) si rappresenta come
x=Hy, y=Hx.
Sistemi di questa forma si chiamano sistemi hamiltoniani e l’integrale primo H(x, y) si
chiama l’ hamiltoniana del sistema.
302 CAPITOLO 10. I SISTEMI DI EQUAZIONI DIFFERENZIALI
Un caso molto importante nel quale `e facile trovare un integrale primo si ha quando si
studia
x′′ =φ(x) ossia x=y
y=φ(x)(10.19)
Si noti che φdipende dalla sola posizione xe non dalla velocit`a y. Assumiamo φ(x)C1(R).
In questo caso
F(x, y) = yiφ(x)j
ha divergenza nulla e quindi il sistema `e hamiltoniano. Calcolando il potenziale di
G(x, y) = φ(x)i+yj
si trova l’integrale primo
V(x, y) = 1
2y2+ Φ(x),Φ(x) = Zx
0
φ(s) ds .
Nelle applicazioni fisiche, il sistema si incontra generalmente scritto nella forma
mx′′ =φ(x)
ove m`e la massa. In tal caso
F(x, y) = yi1
mφ(x)j,G(x, y) = 1
mφ(x)i+yj
ed un integrale primo `e
V(x, y) = 1
mΦ(x) + 1
2y2.
Si `e detto che i multipli di un integrale primo sono ancora integrali primi. Il particolare
multiplo
E(x, y) = 1
2my2+ Φ(x)
si chiama energia totale del sistema, mentre si chiamano rispettivamente energia cinetica
ed energia potenziale le due funzioni my2/2 e Φ(x).
I sistemi della forma (10.19) si dicono conservativi , poich´e l’energia totale (che `e un
integrale primo) rimane costante lungo ogni orbita (in generale ha valore diverso su orbite
diverse):
Teorema 280 L’energia totale “si conserva” (ossia rimane costante) sulle traiettorie di un
sistema conservativo.
Esempio 281 Consideriamo l’equazione
mx′′ =l
gsin x
che rappresenta le oscillazioni di un pendolo di lunghezza costante.7La sua energia totale `e
E(x, y) = 1
2my2+l
gZx
0
sin sds=1
2my2l
g[cos x1] .
7si noti che se le oscillazioni sono “piccole” si pu`o approssimare sin xxed ottenere
l’equazione del moto armonico, x′′ =ω2xcon ω2=l/mg.
10.4. SISTEMI PIANI ED INTEGRALI PRIMI 303
I potenziali sono sempre definiti a meno di una costante additiva, ed usa scegliere come
energia totale la funzione
E(x, y) = 1
2my2l
gcos x .
10.4.1 Integrali primi e stabilit`a
Se si possono studiare le curve di livello di un integrale primo `e possibile ottenere informa-
zioni sulla stabilit`a di un punto di equilibrio. Mostriamo questo su un esempio.
Esempio 282 Si consideri il sistema
x= 2y , y=x .
E’ immediato notare che V(x, y) = x2+ 2y2`e un integrale primo di questo sistema. Le
curve di livello sono le ellissi
x2+ 2y2=c .
Usiamo questo per mostrare che l’origine `e un punto di equilibrio stabile. Si fissi per questo
ǫ > 0 e sia ccos`ı piccolo che l’ellisse x2+ 2y2=csia contenuta nel disco di centro l’origine
e raggio ǫ. Indichiamo con Equest’ellisse.
Sia δ > 0 cos`ı piccolo che la circonferenza di centro l’origine e raggio δsia contenuta
nell’ellisse E, si veda la figura 10.6.
Figura 10.6: Integrali primi e stabilit`a
−2 −1.5 −1 −0.5 0 0.5 1 1.5 2
−2
−1.5
−1
−0.5
0
0.5
1
1.5
2
ε
δ
(x0,y0)
E
Sia (x0, y0) un dato iniziale di norma minore di δ. L’orbita che lo contiene `e contenuta in
un ellisse che appartiene alla regione interna all’ellisse Ee quindi in particolare nell’intorno
dell’origine di raggio ǫ. Ci`o mostra la stabilit`a.
304 CAPITOLO 10. I SISTEMI DI EQUAZIONI DIFFERENZIALI
In generale lo studio geometrico delle curve di livello non `e facile. Vogliamo dare un risultato
di stabilit`a che usi l’idea dell’esempio precedente, ma che non richieda la determinazione
esplicita delle curve di livello. Questo risultato si applica a sistemi della forma
mx=y , y=φ(x) ossia mx′′ =φ(x) con φ(0) = 0. (10.20)
L’origine, ossia il punto di coordinate (0,0), `e punto d’equilibrio di questo sistema.
Si sa che a questo sistema si pu`o associare sia l’energia potenziale
Φ(x),Φ(x) = Zx
0
φ(s) ds
sia l’“energia” totale
E(x, y) = 1
2my2+ Φ(x).
Diciamo che Φ(x) ha minimo stretto in 0 quando
Φ(0) <Φ(x)x6= 0 .
Analoga definizione per l’energia totale E(x, y).
Vale:
Teorema 283 (di Lagrange) Supponiamo che 0sia uno zero isolato di φ(x). Se 0`e punto
di minimo stretto per Φ(x)allora il punto d’equilibrio (0,0) del sistema (10.20) `e stabile.
Dim.Il fatto che Φ(x) abbia un minimo stretto in zero implica che l’energia totale E(x, y)
ha minimo stretto in (0,0):
0 = E(0,0) < E(x, y)(x, y)6= (0,0) .
Inoltre, l’energia totale `e una funzione continua. Fissiamo ǫ > 0 e consideriamo il numero
E0= min{E(x, y),||(x, y)|| =ǫ}.
Essendo (0,0) un minimo stretto, segue che E0>0.
Scegliamo ora σ > 0 tale che se ||(x, y)|| < σ allora si abbia
E(x, y)< E0/2.
Sia (x0, y0) un dato iniziale con ||(x0, y0)|| < σ. Sia (x(t), y(t)) la soluzione corrispondente
a tale dato iniziale. Lungo questa soluzione l’energia si conserva e quindi
E(x(t), y(t)) = E(x0, y0)< E0/2.
Dunque, ||(x(t), y(t))|| non pu`o mai prendere il valore ǫ: se ci`o avvenisse per un valore ¯
tdi
tavremmo infatti E(x(¯
t), y(¯
t)) > E0/2. Quindi, essendo t ||(x(t), y(t))|| una funzione
continua, si ha sempre
||(x(t), y(t))|| < ǫ .
Ossia, se il dato iniziale ha norma minore di σ, in ogni istante successivo la soluzione ha
norma minore di ǫ. L’arbitrariet`a di ǫprova che il punto di equilibrio (0,0) `e stabile.
Dalla definizione di Φ(x) si vede immediatamente:
10.4. SISTEMI PIANI ED INTEGRALI PRIMI 305
Corollario 284 Le condizioni del Teorema 283 sono soddisfatte se la funzione φ(x)verifica
(x)>0.
Esempio 285 Consideriamo l’equazione
x′′ =sin x
che descrive il moto di un pendolo. Le condizioni del Corollario 284 sono soddisfatte e quindi
il punto di equilibrio (0,0) `e stabile.
L’energia totale `e
E(x, y) = 1
2y2+ cos x .
Alcune delle sue curve di livello intorno al punto d’equilibrio (0,0) sono riportate nella
figura 10.7. Dato che l’energia si conserva, una soluzione che ha dato iniziale all’interno
della curva di livello chiusa non esce dalla regione delimitata da questa curva, in accordo
con l’asserto del Teorema di Lagrange. Se per`o il dato iniziale `e “lontano” da (0,0) allora
la traiettoria del sistema ad esso corrispondente si allontana dal punto di equilibrio.
Figura 10.7: Il caso considerato nell’esempio 285
10 20 30 40 50 60
20
40
60
80
100
120
10.4.2 Stabilit`a asintotica e perturbazioni
E’ importante osservare che il teorema di Lagrange dipende da una propriet`a di minimo
che non si conserva sotto l’azione di piccole perturbazioni. E in effetti piccole perturbazioni
possono distruggere la propriet`a di stabilit`a, come mostrano gli esempi seguenti.
306 CAPITOLO 10. I SISTEMI DI EQUAZIONI DIFFERENZIALI
Esempio 286 Consideriamo il sistema scalare
x=ǫx .
Se ǫ= 0 allora il punto d’equilibrio 0 `e stabile, mentre `e instabile per ogni ǫ > 0.
Questo esempio non verifica le ipotesi del teorema di Lagrange. Per trovare invece un
esempio che verifica le ipotesi del teorema di Lagrange, consideriamo
x′′ =ǫxx .
Se ǫ= 0 questa `e l’equazione del moto armonico e verifica le ipotesi del Teorema di Lagran-
ge. Dunque, (0,0) `e punto d’equilibrio stabile come d’altra parte si verifica anche diretta-
mente notando che la matrice corrispondente ha i due autovalori ±i, distinti e puramente
immaginari. Il punto d’equilibrio (0,0) diviene instabile per ogni ǫ > 0.
Esempio 287 Consideriamo ora il sistema
x=yx5, y=xy3.
Questo sistema non ammette integrali primi. Per`o, se (x(t), y(t)) `e una soluzione,
d
dtx(t)
y(t)
2
=2x6(t)2y4(t)<0.
Ci`o mostra che la norma decresce e che quindi il punto di equilibrio (0,0) `e stabile. Si
pu`o provare che `e addirittura asintoticamente stabile. Per`o, la piccola” perturbazione che
consiste nel trascurare i termini x5ed y3, che `e una perturbazione infinitesima di ordine
superiore al primo (rispetto ad (x, y)), ne distrugge la stabilit`a asintotica.
Invece, la stabilit`a asintotica dei sistemi lineari si conserva sotto l’azione di “piccole”
perturbazioni. Questa `e una propriet`a importantissima per le applicazioni, ed anche molto
comoda in pratica perch´e d`a un test facile da usare. Enunciamo il risultato senza provarlo:
Teorema 288 Sia
x=Ax+f(x) (10.21)
e supponiamo che f(0) = 0. Supponiamo inoltre:
la matrice Aabbia tutti gli autovalori con parte reale negativa, cos`ı che il punto di
equilibrio 0di
x=Ax
`e asintoticamente stabile;
Valga
lim
x0
f(x)
||x|| =0.
Sotto queste condizioni il punto d’equilibrio 0`e asintoticamente stabile per il sistema (10.21).
10.4. SISTEMI PIANI ED INTEGRALI PRIMI 307
Il teorema precedente pu`o anche essere precisato: si pu`o provare che se la matrice Aha
un autovalore con parte reale positiva allora l’origine non `e stabile per il sistema (10.21).
Questo teorema in pratica si usa come segue: si ha un sistema della forma
x=g(x),con g(0) = 0.(10.22)
Dato che g(0) = 0, lo sviluppo di McLaurin di garrestato al primo ordine d`a
g(x) = Ax+f(x), A =Jg(0)
e si sa che f(x) `e infinitesimo di ordine maggiore di 1 rispetto a ||x||, ossia
lim
x0
f(x)
||x|| =0.
Se gli autovalori di Ahanno tutti parte reale negativa, allora il punto d’equilibrio 0 del
sistema (10.22) `e asintoticamente stabile.
Si usa dire che il sistema lineare
x=Ax
si ottiene linearizzando in 0 il sistema x=g(x).
Quando si usa questo teorema per studiare la stabilit`a asintotica di un punto di equili-
brio, si dice che si studia la stabilit`a in prima approssimazione.
Indice analitico
2-forma differenziale, 253
1–forma differenziale, 235
3–forma differenziale, 257
condizione di Cauchy, 281
Fresnel, 218
hamiltoniana, 301
infinitesimo, 109
accumulazione, 88
affine, 80
ampiezza, 144
anomalia, 99
arco, 177, 181
arco chiuso, 178
area di un dominio di integrazione, 206
area di una superficie, 248
argomento, 99, 101
ascissa, 97
ascisse, 84
asintoticamente stabile, 297
asse x, 84, 86
asse y, 84, 86
asse z, 86
asse polare, 99
assi cartesiani obliqui, 97
assi coordinati, 84
attrattivo, 297
autonomo, 285
autovalore, 289
autovettori, 289
bacino d’attrazione, 297
base, 79
base canonica, 79
base ordinata, 83
binormale, 197
Bolzano-Weierstrass, 91
bordo, 193, 263
bordo di una calotta, 261
calotta, 191, 192
calotta chiusa, 192
calotta composta, 264
cambiamenti di variabile, 158
campi solenoidali, 257
campi vettoriali, 130
campo conservativo, 269
carattere della serie, 3
chiusa, 82, 278, 279
cilindriche ellittiche, 100
cilindro, 135
circuito, 228
coefficienti di Fourier, 64
coefficienti di una forma differenziale, 236
colatitudine, 101
colineari, 80
combinazione lineare, 79
completo, 91
componenti, 78
comportamento della serie, 3
condizione iniziale, 281
connesso, 82
cono, 136
conservativo, 302
continua, 102
continuit`a, 102, 108
converge normalmente, 43
converge puntualmente, 33
convergenza assoluta, 9, 17, 53
convergenza in media, 37
convergenza incondizionata, 21
convergenza uniforme, 36
convesso, 82
convoluzione, 27
coordinate cilindriche, 97, 100
coordinate curvilinee, 96
coordinate ellittiche, 97
coordinate polari, 97, 99
coordinate polari ellittiche, 99
308
INDICE ANALITICO 309
coordinate sferiche, 101
costante d’Eulero, 29
Criterio di Leibniz, 17
criterio di Leibniz, 31
critici, 114
curva, 165, 180
curva cartesiana, 151, 178
curva definita implicitamente, 160
curva di livello, 134, 160
curva parametrica, 177
curva piana, 177
curva regolare, 178
curva semplice, 178
curvatura, 186, 188
curve coordinate, 100
d’Amp`ere, 86
definita parametricamente, 151
dei valori intermedi, 220
delle ascisse, 86
densit`a, 224, 249
derivata, 104
derivata n–ma, 121
derivata di un campo vettoriale secondo un
vettore, 131
derivata direzionale, 117
derivata direzionale di un campo vettoriale,
131
derivata secondo un vettore, 117
derivata termine a termine, 48
derivate miste, 121
derivate parziali, 113
di Brower, 221
di superficie, 251
differenziale, 114, 127, 236
differenziale esterno, 243
distanza, 88
distanza (tra funzioni), 34
divergenza, 132
dominio, 82, 281
dominio di integrazione, 209
energia cinetica, 302
energia potenziale, 269, 302
energia totale, 302
equazione lineare omogenea associata, 289
Equazioni di Frenet, 198
equazioni di Frenet, 187
equilibrio, 285
esatta, 279
esponenziale di matrici, 56
estremali, 114
estremi, 81
estremi (di una curva), 233
estremi assoluti, 124
estremi globali, 124
fase, 142, 144
flusso, 237
flusso attraverso D, 236
flusso attraverso un dominio di integrazione,
237
flusso attraverso una superficie, 250
flusso di un campo vettoriale attraverso una
curva, 237
forma differenziale esatta, 278
formula degli incrementi finiti, 128
formula della derivazione a catena, 117
formula di Gauss, 257
formula di Green, 241
Formula di Guldino, 216
formula di Guldino, 248
formula di Riemann, 267
formula di Stirling, 12
formula di Taylor, 105
formula do Ostrogradski, 267
formule d’Eulero, 61
frequenza, 143
frequenza angolare, 145
frontiera, 88
funzione definita implicitamente, 156
funzione di Dirichlet,, 39
funzione differenziabile, 114
funzione implicita, 156, 158
funzione omogenea, 146
funzioni di classe C1(Ω), 114
funzioni omogenee, 135
Identit`a di Parseval, 64
incidenti, 81
incrementi finiti, 105
infinitesimo, 103, 108
insieme connesso, 82
insieme di livello, 134, 152
insieme stellato, 82
integrale di 1–forma differenziale, 235
310 INDICE ANALITICO
integrale di curva di prima specie, 226
integrale di curva di seconda specie, 227
integrale di flusso, 267
integrale di linea, 267
integrale di superficie di prima specie, 250
integrale di superficie di seconda specie, 250
integrale doppio, 205, 206
integrale generale, 289
integrale improprio, 219
integrale improprio su R2, 219
integrale iterato, 120
integrale primo, 300
integrale semplice, 206
integrale superficiale, 267
integrale triplo, 209
integrali curvilineo, 267
integrazione termine a termine, 48
interferenza, 146
interno, 88
intervallo di convergenza (di una serie di po-
tenze), 45
intorno, 88
irrotazionale, 273
istante iniziale, 281
jacobiano, 128
l’identit`a di Parseval, 67
lagrangiana, 174
laplaciano, 133
legge del moto, 179
legge oraria, 185
limitata, 88, 91
limitate in futuro, 297
limitatezza in passato., 297
limitato, 88
limite, 108
limiti, 102
linearit`a, 104
linearit`a della derivata, 104
linearmente indipendenti, 79
longitudine, 101
lunghezza d’onda, 144
lunghezza del multiindice, 121
lunghezza di un arco, 183
matrice Hessiana, 126
matrice jacobiana, 128
media quadratica, 37
modulo, 101
moltiplicatore di Lagrange, 167, 173
moltiplicatori di Lagrange, 167, 173
moto armonico, 143
multiindice, 121
nastro di obius, 265
norma, 87
norma euclidea, 88
normale esterna, 190
numero d’onde, 145
numero d’onde angolare, 145
oblique, 96
onda, 140
onda piana, 143
onda progressiva, 141
onda regressiva, 141
onda sferica, 143
onda stazionaria, 146
onde armoniche, 142, 143
orbita, 285
ordinata, 97
ordinate, 84, 86
ordine, 179
orientazione, 84, 85, 196, 262
orientazione di una superficie, 261
orientazione di una curva semplice chiusa,
189
orientazione positiva, 189
origine, 78, 84
ortogonali, 92, 93
ortogonalit`a ad una curva, 161
palla, 88
parallele, 80
parallelogramma, 92
parametrizzazione canonica, 184
parametro d’arco, 184
parametro di una superficie, 191
periodo, 58, 143
piani coordinati, 86
piano delle fasi, 294
piano osculatore, 197
piano per l’origine, 80
piano tangente, 195
polinomio caratteristico, 289
INDICE ANALITICO 311
polinomio trigonometrico, 62
polo, 99
potenziale, 269
prima formula degli incrementi finiti, 105
primitiva, 278, 279
prodotto alla Cauchy, 26, 27
prodotto alla Cauchy (di serie di potenze),
52
prodotto interno, 91
prodotto scalare, 91
progressione geometrica, 5
proiezione ortogonale, 67, 100
punti critici, 160
punti stazionari, 114
punto critico isolato, 285
punto di massimo, 112, 124
punto di minimo, 112, 124
punto di sella, 125
quote, 86
raggio di convergenza, 45
ragione, 5
regione di Jordan, 189
regione esterna ad una curva, 188
regione interna ad una curva, 188
regola d’Amp`ere, 189, 262
regola di Amp`ere, 189
resto della formula di Taylor, 122
retta per x0, 80
rette coordinate, 84, 86
rette per l’origine, 80
riferimento mobile, 187, 197, 198
rotore, 132
s.spazi affini, 80
s.spazio lineare, 79
scalari, 78
scambio di ordine di integrazione, 208
segmento, 81
semplicemente connessa, 274
serie, 3
serie a segni alterni, 17
serie armonica, 12
serie convergenti, 3
serie di funzioni, 21
serie di Fourier, 57, 65
serie di funzioni, 42
serie di Mengoli, 18
serie divergenti, 3
serie geometrica, 5
serie indeterminata, 3
serie oscillanti, 3
serie regolare, 3
serie telescopica, 5
sfasamento, 144
sfasate, 144
sferiche, 97
sghembe, 81
sistema di equazioni differenziali lineari, 56
sistema fondamentale, 291
sistema hamiltoniano, 301
sistemi ortonormali, 63
sistemi piani, 294
soluzione generale, 289
soluzione stazionaria, 285
somma di una serie, 4
sommazione per parti, 29
somme parziali, 3
sostegno, 180, 192
sostegno di una superficie, 191
sottospazio, 79
spazio lineare, 78
spazio vettoriale, 78
spettro, 67
spezzata, 82
spezzata di Eulero, 287
stabile, 297
stazionario, 285
stellato, 82
successione, 88
successione crescente, 2
successione decrescente, 2
successione di Cauchy, 90
successione di funzioni, 33
successione fondamentale, 1, 90
successione numerica, 1
successioni divergenti, 90
suono di Tartini, 146
superfici cartesiane, 151
superfici coordinate, 100
superficie, 135
superficie cartesiana, 191
superficie chiusa, 191, 259
superficie definita implicitamente, 164
superficie definita parametricamente, 191
312 INDICE ANALITICO
superficie regolare, 191
superficie semplice, 191
tangente ad una curva, 185, 187
tangente alla curva, 161
Taylor, 105
tempo invariante, 285
teorema della derivazione a catena, 130
Teorema della divergenza, 256
Teorema della divergenza nel piano, 242
Teorema della funzione implicita, 154, 155,
157
Teorema della funzione inversa, 159
teorema della funzione inversa, 158
teorema della media, 207
Teorema di Abel, 31, 44, 46, 53
Teorema di Cauchy (per le serie), 8
Teorema di Dirichlet, 21, 31
Teorema di Gauss, 267
Teorema di Jordan, 188
Teorema di Pitagora, 92
Teorema di Schwarz, 121
teorema di Stokes, 262
termine generale (di una serie), 3
terzo suono, 146
Test di MacLaurin, 15
test di Weierstrass, 43
torsione, 198
uniforme continuit`a, 112
variet`a, 266
variet`a orientabile, 266
velocit`a, 104, 179
velocit`a angolare, 143
velocit`a di fase, 142
velocit`a di propagazione, 141
versore, 92
versore normale, 185, 188
vettore applicato, 83
vettore normale, 114, 195
vettore nullo, 78
vettori liberi, 83
vincolato, 165